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第 3 版 前 言 加 


全 国 计 算 机 技术 与 软件 专业 技术 资格 (水平) 考试 实施 至 今 已 经 历 了 二 十 余年 ， 在 社会 上 
产生 了 很 大 的 影响 ， 对 我 国 软件 产业 的 形成 和 发 展 做 出 了 重要 的 贡献 。 为 了 适应 我 国 计 算 机 信 
息 技 术 发 展 的 需求 ， 人 力 资源 和 社会 保障 部 、 工 业 和 信息 产业 部 决定 将 考试 的 级 别 拓展 到 计算 
机 信息 技术 行业 的 各 个 方面 ， 以 满足 社会 上 对 各 种 计算 机 信息 技术 人 才 的 需要 。 

编者 受 全 国 计 算 机 专业 技术 资格 考试 办 公 室 委托 ， 对 《数据 库 系统 工程 师 教程 》 一 书 进行 
改写 ， 以 适应 新 的 考试 大 纲要 求 。 在 考试 大 纲 中 ， 要 求 考生 掌握 的 知识 面 很 广 ， 每 个 章节 的 内 
容 都 能 构成 相关 领域 的 一 门 课程 ， 因 此 编写 的 难度 很 高 。 考 虑 到 参加 考试 的 人 员 已 有 一 定 的 基 
础 ， 所 以 本 书 中 只 对 考试 大 纲 中 所 涉及 的 知识 领域 的 要 点 加 以 阐述 ， 但 限于 篇 幅 所 限 ， 不 能 详 
细 地 展开 ， 请 读者 谅解 。 

全 书 共 分 14 章 ， 各 章节 内 容 安排 如 下 : 

第 1 章 主要 介绍 计算 机 系统 基础 知识 、 计 算 机 体系 结构 以 及 安全 性 、 可 靠 性 和 系统 性 能 评 
测 基础 、 多 媒体 基础 知识 。 

第 2 章 主 要 介绍 程序 设计 语言 的 基本 概念 与 基本 成 分 ， 阐 述 了 汇编 程序 、 编 译 程序 与 解释 
程序 的 基本 原理 。 

第 3 章 主要 介绍 数据 结构 中 线性 结构 、 数 组 、 矩 阵 、 树 和 图 的 基本 概念 ， 阐 述 了 查找 和 排 
序 的 基本 方法 和 算法 ， 算 法 设计 与 分 析 的 基本 概念 等 。 

第 4 章 主要 介绍 操作 系统 中 进程 管理 、 存 储 管理 、 设 备 管理 、 文 件 管理 、 作 业 管 理 以 及 网 
络 语 嵌 入 式 操作 系统 基础 知识 。 

第 5 章 主要 介绍 网 络 体系 结构 、 网 络 互联 硬件 、 网 络 协议 与 标准 、Internet 应 用 以 及 网 络 
安全 知识 。 

第 6 章 主要 介绍 数据 库 系统 的 基本 概念 、 数 据 模型 、 数 据 存储 与 查询 、 数 据 仓库 与 数据 挖 
掘 基础 知识 。 

第 7 章 主要 介绍 关系 数据 库 基 本 概念 、 关 系 运算 、 元 组 演算 、 域 演算 、 查 询 优化 以 及 关系 
数据 库 设计 基础 理论 。 

第 8 章 主 要 介绍 SQL 的 功能 与 特点 、SQL 数据 定义 语言 ( 表 、 视 图 、 索 引 、 约 束 )、 SQL 
数据 操作 语言 (数据 检索 、 数 据 插入 /删除 /更 新 )、 创 建 与 删除 触发 器 、SQL 数据 控制 语言 〈 安 
全 性 和 授权 、 事 务 处 理 ) 以 及 嵌入 式 SQL。 
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第 9 章 主要 介绍 软件 工程 基础 知识 、 面向 对 象 的 基本 概念 、 面向 对 象 程序 设计 与 开发 技术 、 
讨论 了 面向 对 象 分 析 与 设计 方法 ， 介 绍 了 软件 系统 设计 、 实 施 和 运行 维护 方面 的 知识 。 
第 10 章 主要 介绍 数据 库 应 用 系统 设计 过 程 涉及 的 内 容 ， 包 括 概念 结构 设计 、 逻 辑 结构 设 
计 、 物 理 结构 设计 、 数 据 库 系统 实施 、 数 据 库 运 行 维护 与 管理 、 性 能 调整 以 及 用 户 支 持 。 

第 11 章 主 要 介绍 事务 的 基本 概念 、 并 发 控制 和 封锁 协议 、 数 据 库 备 份 与 恢复 、 数 据 库 的 
安全 性 与 完整 性 。 

第 12 章 主 要 介绍 分 布 式 数据 库 基 本 概念 与 应 用 、 网 络 环境 下 数据 库 系 统 的 设计 与 实施 、 
面向 Web 的 数据 库 管 理 系统 (DBMS ) 技术 以 及 数据 库 系 统 的 发 展 趋势 。 

第 13 章 主要 介绍 标准 化 与 知识 产权 基础 知识 。 

第 14 章 主要 介绍 数据 库 应 用 案例 ， 重 点 介绍 SQL 应 用 案例 和 数据 库 设 计 应 用 案例 。 

本 书 第 1 一 3 章 由 张 淑 平 编写 ， 第 4 章 由 王 亚 平 编写 ， 第 5 章 由 严 体 华 编写 ， 第 6 一 8 章 
王 亚 平 编写 ， 第 9 章 由 褚 华 编写 ,第 10 章 由 王 亚 平 、 苏 向 阳 编号， 第 11 章 由 王 亚 平 编写 ， 第 
12 章 由 高 海 昌 编写 ， 第 13 章 由 刘强 编写 ， 第 14 章 由 王 亚 平 编写 ， 最 后 由 王 亚 平 统 稿 。 
在 本 书 的 编写 过 程 中 ， 参 考 了 许多 相关 的 书籍 和 资料 ， 编 者 在 此 对 这 些 参考 文献 的 作者 表 
示 感 谢 。 同 时 感谢 清华 大 学 出 版 社 在 本 书 出 版 过 程 中 所 给 予 的 支持 和 帮助 。 
因 作者 的 水 平 有 限 ， 书 中 难免 存在 错漏 和 不 妥 之 处 ， 望 读者 指正 ， 以 利 改进 和 提高 。 


编 者 


2018 年 元 月 
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1.1 计算 机 系统 基础 知识 


计算 机 系统 是 由 硬件 和 软件 组 成 的 ， 它 们 协同 工作 来 运行 程序 。 计 算 机 的 基本 硬件 系统 由 
运算 器 、 控 制 器 、 存 储 器 、 输 入 设备 和 输出 设备 5 大 部 件 组 成 。 运 算 器 、 控 制 器 等 部 件 被 集成 
在 一 起 统称 为 中 央 处 理 单元 〈Central Processing Unit，CPU) 。CPU 是 硬件 系统 的 核心 ， 用 于 
数据 的 加 工 处 理 , 能 完成 算术 运算 、 逻 辑 运算 及 控制 功能 。 存 储 器 是 计算 机 系统 中 的 记忆 设备 ， 
分 为 内 部 存储 器 和 外 部 存储 器 。 前 者 速度 高 、 容 量 小 ， 一 般 用 于 存储 运行 过 程 中 的 程序 、 数 据 
及 中 间 结 果 。 而 后 者 容量 大 、 速 度 慢 ， 可 以 长 期 保存 程序 和 数据 。 输 入 设备 和 输出 设备 合 称 为 
外 部 设备 (简称 外 设 ) ， 输 入 设备 用 于 输入 原始 数据 及 各 种 命令 ， 而 输出 设备 则 用 于 输出 计算 
机 运行 的 结果 。 

1.1.1 中 央 处 理 单元 


中 央 处 理 单元 (CPU) 是 计算 机 系统 的 核心 部 件 ， 它 负责 获取 程序 指令 、 对 指令 进行 译 码 
并 加 以 执行 。 
1，CPU 的 功能 


(1) 程序 控制 。CPU 按照 程序 的 安排 来 执行 指令 ， 保 证 程序 指令 严格 按 规 定 的 顺序 执行 ， 
通过 执行 程序 控制 计算 机 的 行为 。 

(2) 操作 控制 。 一 条 指令 功能 的 实现 需要 若干 操作 信号 来 完成 ，CPU 产生 每 条 指令 的 操 
作 信 号 并 将 操作 信号 送 往 不 同 的 部 件 ， 控 制 相应 的 部 件 按 指令 的 功能 要 求 进行 操作 。 

(3) 时 间 控 制 。CPU 对 每 条 指令 的 整个 执行 时 间 要 进行 严格 控制 。 同 时 ， 指 令 执行 过 程 
中 操作 信号 的 出 现时 间 、 持 续 时 间 及 出 现 的 时 间 顺 序 都 需要 进行 严格 控制 。 
(4) 数据 处 理 。CPU 通过 对 数据 进行 算术 运算 及 逻辑 运算 等 方式 进行 加 工 处 理 ， 数 据 加 
工 处 理 的 结果 为 人 们 所 使 用 。 所 以 ， 对 数据 的 加 工 处 理 是 CPU 最 根本 的 任务 。 
此 外 ，CPU 还 需要 对 系统 内 部 和 外 部 的 中 断 〈 蜡 常 ) 做 出 响应 ， 进 行 相应 的 处 理 。 
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2. CPU 的 组 成 
CPU 主要 由 运算 器 、 控 制 器 、 寄 存 器 组 和 内 部 总 线 等 部 件 组 成 ， 如 图 1-1 所 示 。 


控制 | 

: | 时 钟 

存储 器 | 
指令 | 

让 译 码 器 

| c | 

输入 输出 接口 KD 上: So EE [关于 各 | 
| 总 线 ( ) C | 

| 于 忆 吉 CDBUS 各 | 

| 

地 址 总 线 (ABUS) ee | 
CPU 


图 1-1 CPU 基本 组 成 结构 示意 图 


1) 运算 器 
运算 器 包括 算术 逻辑 单元 (Arithmetic and Logic Unit，ALU) 、 累 加 器 、 缓 冲 寄存 器 和 状 
态 条 件 寄存 器 等 ， 它 是 数据 加 工 处 理 部 件 ， 完 成 所 规定 的 各 种 算术 和 逻辑 运算 。 相 对 控制 器 而 
| 


， 运 算 器 接受 控制 器 的 命令 而 进行 动作 ， 即 运算 器 所 进行 的 全 部 操作 都 是 由 控制 器 发 出 的 控 
制 信号 来 指挥 的 ， 所 以 它 是 执行 部 件 。 运 算 器 有 如 下 两 个 主要 功能 。 
(1) 执行 所 有 的 算术 运算 ， 如 加 、 减 、 乘 、 除 等 基本 运算 及 附加 运算 。 
(2) 执行 所 有 的 逻辑 运算 并 进行 逻辑 测试 ， 如 与 、 或 、 非 、 零 值 测试 或 两 个 值 的 比较 等 。 
下 面 简要 介绍 运算 器 中 各 部 件 的 组 成 和 功能 。 
(1) 算术 逻辑 单元 。ALU 是 运算 器 的 重要 组 成 部 件 ， 负 责 处 理 数据 ， 实 现 对 数据 的 算术 运 
(2) 累加 寄存 器 (AC) 。AC 通常 简称 为 累加 器 ， 它 是 一 个 通用 寄存 器 。 其 功能 是 当 运算 
器 的 算术 逻辑 单元 执行 算术 或 逻辑 运算 时 ， 为 ALU 提供 一 个 工作 区 。 例 如 ， 在 执行 一 个 减法 
运算 前 ， 先 将 被 减 数 暂 存在 AC 中 ， 再 从 内 存储 器 中 取出 减 数 ， 然 后 与 AC 的 内 容 相 减 ， 所 得 
的 结果 送 回 AC 暂 存 。 
(3) 数据 缓冲 寄存 器 (DR) 。 在 对 内 存储 器 进行 读 写 操作 时 ， 用 DR 暂时 存放 由 内 存储 器 
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读 写 的 一 条 指令 或 一 个 数据 字 ， 将 不 同时 间 段 内 读 写 的 数据 隔离 开 来 。DR 的 主要 作用 为 : 作 
为 CPU 和 内 存 、 外 部 设备 之 间 数 据 传送 的 中 转 站 ; 作为 CPU 和 内 存 、 外 围 设备 之 间 在 操作 速 
度 上 的 缓冲 ; 在 单 累加 器 结构 的 运算 器 中 ， 数 据 缓 冲 寄存 器 还 可 兼作 为 操作 数 寄存 器 。 

(4) 状态 条 件 寄存 器 (PSW) 。PSW 保存 根据 算术 指令 和 逻辑 指令 运行 或 测试 的 结果 建 
立 的 各 种 条 件 码 内 容 ， 主 要 分 为 状态 标志 和 控制 标志 ， 如 运算 结果 进位 标志 〈C) 、 运 算 结 果 
溢出 标志 (V) 、 运 算 结果 为 0 标志 (Z) 、 运 算 结果 为 负 标志 (N) 、 中 断 标志 (ID) 、 方 向 标 
志 (D) 和 单 步 标志 等 。 这 些 标 志 通 常 分 别 由 1 位 触发 器 保存 ， 保 存 了 当前 指令 执行 完成 之 后 
的 状态 。 通 常 ， 一 个 算术 操作 产生 一 个 运算 结果 ， 而 一 个 逻辑 操作 则 产生 一 个 判决 。 

2) 控制 器 

控制 器 用 于 控制 整个 CPU 的 工作 ， 它 决定 了 计算 机 运行 过 程 的 自动 化 。 它 不 仅 要 保证 程 
序 的 正确 执行 ， 而 且 要 能 够 处 理 异 常事 件 。 控 制 器 一 般 包 括 指令 控制 逻辑 、 时 序 控制 逻辑 、 总 
线 控制 逻辑 和 中 断 控制 逻辑 等 儿 个 部 分 。 

指令 控制 逻辑 要 完成 取 指 令 、 分 析 指 令 和 执行 指令 的 操作 , 其 过 程 分 为 取 指 令 、 指 令 译 码 、 
按 指令 操作 码 执行 、 形 成 下 一 条 指令 地 址 等 步骤 。 控制 器 在 工作 过 程 中 主要 使 用 下 述 几 个 部 件 。 

(1) 指令 寄存 器 (IR) 。 当 CPU 执行 一 条 指令 时 ， 先 把 它 从 内 存储 器 取 到 缓冲 寄存 器 中 ， 
再 送 入 IR 暂 存 ， 指 令 译 码 器 根据 IR 的 内 容 产 生 各 种 微 操作 指令 ， 控 制 其 他 部 件 协 调 工作 ， 完 
成 指令 的 功能 。 

(2) 程序 计数 器 (PC) 。PC 具有 寄存 信息 和 计数 两 种 功能 ， 又 称 为 指令 计数 器 。 程 序 的 
执行 分 两 种 情况 ， 一 是 顺序 执行 ， 二 是 转移 执行 。 在 程序 开始 执行 前 ， 将 程序 的 起 始 地 址 送 入 
PC， 该 地 址 在 程序 加 载 到 内 存 时 确定 ， 因 此 PC 的 内 容 即 是 程序 第 一 条 指令 的 地 址 。 执 行 指令 
时 ，CPU 将 自动 修改 PC 的 内 容 ， 以 便 使 其 保持 的 总 是 将 要 执行 的 下 一 条 指令 的 地 址 。 由 于 大 
多 数 指令 都 是 按 顺 序 来 执行 的 ， 所 以 修改 的 过 程 通常 只 是 简单 地 对 PC 加 1。 当 遇 到 转移 指令 
时 ， 后 继 指 令 的 地 址 根据 当前 指令 的 地 址 加 上 一 个 向 前 或 向 后 转移 的 位 移 量 产生 ， 或 者 根据 转 
移 指令 给 出 的 直接 转移 的 地 址 产生 ， 再 送 入 PC。 

(3) 地 址 寄存 器 (AR) 。AR 保存 当前 CPU 所 访问 的 内 存单 元 的 地 址 。 由 于 内 存 和 CPU 
存在 着 操作 速度 上 的 差异 ， 所 以 需要 使 用 AR 保持 地 址 信息 ， 直 到 内 存 的 读 / 写 操作 完成 为 止 。 

(4) 指令 译 码 器 (ID) 。 指 令 包含 操作 码 和 地 址 码 两 部 分 ， 为 了 能 执行 任何 给 定 的 指令 ， 
必须 对 操作 码 进行 分 析 ， 以 便 识 别 要 进行 的 操作 。 指 令 译 码 器 就 是 对 指令 中 的 操作 码 字 段 进行 
分 析 解 释 ， 识 别 该 指令 规定 的 操作 ， 向 操作 控制 器 发 出 具体 的 控制 信号 ， 控 制 各 部 件 工作 ， 完 
成 所 需 的 功能 。 

时 序 控制 逻辑 要 为 每 条 指令 按时 间 顺 序 提供 应 有 的 控制 信号 。 总 线 逻 辑 是 为 多 个 功能 部 件 
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服务 的 信息 通路 的 控制 电路 。 中 断 控 制 逻 辑 用 于 控制 各 种 中 断 请 求 ， 并 根据 优先 级 的 高 低 对 中 
断 请 求 进行 排队 ， 逐 个 交 给 CPU 处 理 。 

3) 寄存 器 组 

寄存 器 组 可 分 为 专用 寄存 器 和 通用 寄存 器 。 运 算 器 和 控制 器 中 的 寄存 器 是 专用 寄存 器 ， 其 
作用 是 固定 的 。 通 用 寄存 器 用 途 广泛 并 可 由 程序 员 规定 其 用 途 , 其 数目 因 处 理 器 不 同 有 所 差异 。 


3. 多 核 CPU 


CPU 的 核心 又 称 为 内 核 , 是 CPU 最 重要 的 组 成 部 分 。 CPU 中 心 那 块 隆起 的 芯片 就 是 核心 ， 
是 由 单 晶 硅 以 一 定 的 生产 工艺 制造 出 来 的 ，CPU 所 有 的 计算 、 接 收 /存储 命令 、 处 理 数据 都 由 
核心 执行 。 各 种 CPU 核心 都 具有 国定 的 逻辑 结构 ， 一 级 缓存 、 二 级 缓存 、 执 行 单元 、 指 令 级 单 
元 和 总 线 接口 等 逻辑 单元 都 需要 合理 的 布局 。 

多 核 即 在 一 个 单 芯片 上 面 集成 两 个 甚至 更 多 个 处 理 器 内 核 , 其 中 每 个 内 核 都 有 自己 的 逻辑 
单元 、 控 制 单元 、 中 断 处 理 器 、 运 算 单元 ， 一 级 Cache、 二 级 Cache 共享 或 独 有 ， 其 部 件 的 完 
整 性 和 单 核 处 理 器 内 核 相 比 完全 一 致 。 

起 初 ，CPU 的 主要 厂商 AMD 和 Intel 的 双核 技术 在 物理 结构 上 有 很 大 不 同 。AMD 将 两 个 
内 核 做 在 一 个 Die〈 唱 元 ) 上 ， 通 过 直 连 架构 连接 起 来 ， 集 成 度 更 高 。Intel 则 是 将 放 在 不 同 核 
心 上 的 两 个 内 核 封装 在 一 起 ， 因 此 有 人 将 Intel 的 方案 称 为 “ 双 芯 ”， 将 AMD 的 方案 称 为 “ 双 
核 ”。 从 用 户 端的 角度 来 看 ，AMD 的 方案 能 够 使 双核 CPU 的 管 脚 、 功 耗 等 指标 跟 单 核 CPU 
保持 一 致 ， 从 单 核 升级 到 双核 ， 不 需要 更 换 电 源 、 芯 片 组 、 散 热 系 统 和 主板 ， 只 需要 刷新 BIOS 
软件 即 可 。 

多 核 CPU 系统 最 大 的 优点 (也 是 开发 的 最 主要 目的 ) 是 可 满足 用 户 同时 进行 多 任务 处 理 
等 要 求 。 

单 核 多 线程 CPU 是 交替 地 转换 执行 多 个 任务 ， 只 不 过 交替 转换 的 时 间 很 短 ， 用 户 一 般 感 
觉 不 出 来 。 如 果 同 时 执行 的 任务 太 多 ， 就 会 感觉 到 “ 慢 ” 或 者 “ 卡 ”。 而 多 核 在 理论 上 则 是 在 
任何 时 间 内 每 个 核 各 执行 各 自 的 任务 ， 不 存在 交替 问题 。 因 此 ， 单 核 多 线程 和 多 核 〈 一 般 每 核 
也 是 多 线程 的 ) 虽然 都 可 以 执行 多 任务 ， 但 多 核 的 速度 更 快 。 

虽然 采用 了 Intel 超 线程 技术 的 单 核 可 以 视 为 双核 ，4 核 可 以 视 为 8 核 。 然 而 ， 视 为 8 核 一 
般 比 不 上 实际 是 8 核 的 CPU 性 能 。 

要 发 挥 CPU 的 多 核 性 能 ， 就 需要 操作 系统 能 够 及 时 、 合 理 地 给 各 个 核 分 配 任务 和 资源 (如 
缓存 、 总 线 、 内 存 等 ) ， 也 需要 应 用 软件 在 运行 时 可 以 把 并 行 的 线程 同时 交付 给 多 个 核心 分 别 
处 理 。 
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1.1.2 数据 表示 和 校 验 


各 种 数值 在 计算 机 中 表示 的 形式 称 为 机 器 数 , 其 特点 是 采用 二 进 制 计数 制 , 数 的 符号 用 0、 
1 表示， 小数 点 则 隐 含 表示 而 不 占 位置 。 机 器 数 对 应 的 实际 数值 称 为 数 的 真 值 。 

机 器 数 有 无 符号 数 和 带 符号 数 之 分 。 无 符号 数 表示 正 数 ， 在 机 器 数 中 没有 符号 位 。 对 于 无 
符号 数 ， 若 约定 小 数 点 的 位 置 在 机 器 数 的 最 低位 之 后 ， 则 是 纯 整 数 ， 若 约定 小 数 点 的 位 置 在 机 
器 数 的 最 高 位 之 前 ， 则 是 纯 小 数 。 对 于 带 符号 数 ， 机 器 数 的 最 高 位 是 表示 正 、 负 的 符号 位 ， 其 
余 位 则 表示 数值 。 若 约定 小 数 点 的 位 置 在 机 器 数 的 最 低 数值 位 之 后 ， 则 是 纯 整 数 ， 若 约定 小 数 
点 的 位 置 在 机 器 数 的 最 高 数值 位 之 前 〈 符 号 位 之 后 ) ， 则 是 纯 小 数 。 


1. 数值 数据 编码 


为 了 便于 运算 ， 带 符号 的 机 器 数 可 采用 原 码 、 反 码 和 补 码 等 不 同 的 编码 方法 。 
(1) 原 码 表示 法 。 数 值 头 的 原 码 记 为 [X]， 如 果 机 器 字 长 为 n〈 即 采用 n 个 二 进 制 位 表 


示 数 据 ) ， 则 原 码 的 定义 如 下 : 


nl 

若是 纯正 数 ， mea 化 ， ee 

| -(2"7 -1D)<X<0 

学 0<X<l 
若是 纯 小 数 ， mcoi=| 

29+| 天 | -1<X<0 
【 例 1.1】 车 机 器 字 长 n 等 于 8， 分 别 给 出 +1，-1，+127，-127，+45，-45，+0.5，-0.5 

的 原 码 表示 。 

[+1]m=0 0000001 [-1]# =1 0000001 


[+127 需 =0 1111111  [-127]x=11111111 

[+45 款 =0 0101101 [-45]x =1 0101101 

[+0.5] 二 0 91000000 。”[-0.5]& 二 1 91000000〈 其 中 69 是 小 数 点 的 位 置 ) 

在 原 码 表示 法 中 ， 最 高 位 是 符号 位 ，0 表示 正 号 ，1 表示 负 号 ， 其 余 的 n-l1 位 表示 数值 的 
绝对 值 。 数 值 0 的 原 码 表 示 有 两 种 形式 : [+0] 二 0 0000000，[--0] 上 一 1 0000000 。 

(2) 反 码 表示 法 。 数 值 蕊 的 反 码 记 作 [X] ， 如 果 机 器 字 长 为 x"， 则 反 码 定义 如 下 : 


» 0gX&2"!-1 
若 匹 是 纯 整数 ， 则 [X]E 一 ， 

2 14+ 琅 -DX<0 

下 0<X<l 
若是 纯 小 数 ， 则 [X]& 二 ee 

2-20D +X -1<X<0 


【 例 1.2】 若 机 器 字 长 等 于 8， 分 别 给 出 +1，-1，+127，-127，+45，-45，-+0.5，--0.5 
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的 反 码 表示 。 
[+HR 一 0 0000001 [DR=11111110 
[+127]&=0 1111111  [-127]a=10000000 
[+45]g =0 0101101 [-45]a =1 1010010 


[+0.5]&g=0 01000000 [-0.5]& 二 19 0111111 (其 中 0 是 小 数 点 的 位 置 ) 


在 反 码 表示 中 ， 最 高 位 是 符号 位 ，0 表示 正 号 ，1 表示 负 号 ， 正 数 的 反 码 与 原 码 相同 ， 负 
数 的 反 码 则 是 其 绝对 值 按 位 求 反 。 数 值 0 的 反 码 表示 有 两 种 形式 : [+0]s 二 0 0000000， 
[Olga=11111111. 


(3) 补 码 表示 法 。 数 值 臣 的 补 码 记 作 [ 辐 和， 如 果 机 器 字 长 为 mw， 则 补 码 定义 如 下 : 


nl] 

若 丈 是 纯 牙 数 ， mo {2 et 

2"+X -2™ <X<0 
若是 纯 小 数 ， wo {2 Us 

2+X -lg<X<0 
【 例 1.3】 若 机 器 字 长 n 等 于 8， 分 别 给 出 +1，-1，+127，-127，+45，-45，+0.5，--0.5 

的 补 码 表示 。 

[HH,=0 0000001 [CH,=11111111 
[=01111111 [1 =1 0000001 
[H45],=0 0101101 [-45], =11010011 


[+0.5]¥, =0 01000000 [-0.5]% 二 190 1000000 (其 中 0 是 小 数 点 的 位 置 ) 

在 补 码 表 示 中 ， 最 高 位 为 符号 位 ，0 表示 正 号 ，1 表示 负 号 ， 正 数 的 补 码 与 其 原 码 和 反 码 
相同 ,负数 的 补 码 则 等 于 其 反 码 的 末尾 加 1。 在 补 码 表示 中 ,0 有 唯一 的 编码 : [+0]#, 二 0 0000000， 
[—0]#,=00000000 。 

(4) 移 码 表示 法 。 移 码 表 示 法 是 在 数 世 上 增加 一 个 偏 移 量 来 定义 的 ， 常 用 于 表示 浮 点 数 中 
的 阶 码 。 如 果 机 器 字 长 为 mm 规定 偏 移 量 为 2™””， 则 移 码 定义 如 下 : 

车 蕊 是 纯 整数 ， 则 [了 ]# 王 2 + 天 (-2 <X<2"); 车 天 是 纯 小 数 ， 则 [了 朴 一 1+ 
X(-1<X<l). 

【 例 1.4】 若 机 器 字 长 n 等 于 8， 分 别 给 出 +1，-1，+127,，-127，+45，-45，+0.5，-0.5， 


+0，-0 的 移 码 表示 。 
[+1]g=1 0000001 [Hz=0 1111111 


[+127]#=1 1111111  [-127]g=00000001 
[+45]g=1 0101101 [-45]g=0 1010011 
[+0.5]g 二 10 1000000  ”[-0.5]g 二 0 01000000 〈 其 中 9 是 小 数 点 的 位 置 ) 
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[+0]g=1 0000000 [-0]g%=10000000 

实际 上 ， 在 偏 移 2” 的 情况 下 ， 只 要 将 补 码 的 符号 位 取 反 便 可 获得 相应 的 移 码 表示 。 

所 谓 定点 数 ， 就 是 小 数 点 的 位 置 固定 不 变 的 数 。 小 数 点 的 位 置 通常 有 两 种 约定 方式 : 定点 
整数 〈 纯 整数 ， 小 数 点 在 最 低 有 效 数 值 位 之 后 ) 和 定点 小 数 〈 纯 小 数 ， 小 数 点 在 最 高 有 效 数值 
位 之 前 ) 。 

设 机 器 字 长 为 mw ， 各 种 码 制 下 带 符号 数 的 定点 表示 范围 如 表 1-1 所 示 。 


表 1-1 机 器 字 长 为 n 时 各 种 码 制 表示 的 带 符号 数 的 范围 


码 制 定点 整数 定点 小 数 
原 码 -2™" -DD~+(2™ -D) —(1-2-"»)~+(1-2-") 
网 rt) 
H ET 
本 ET 


2， 浮 点 表示 


当 机 器 字 长 为 n 时 ， 定 点 数 的 补 码 和 移 码 可 表示 2 个 数 ， 而 其 原 码 和 反 码 只 能 表示 2”-1 

个 数 〈0 的 表示 占用 了 两 个 编码 ) ， 因 此 ， 定 点 数 所 能 表示 的 数值 范围 比较 小 ， 运 算 中 很 容易 
因 结 果 超 出 范围 而 溢出 。 因 此 引入 浮 点 数 ， 浮 点 数 是 小 数 点 位 置 不 固定 的 数 ， 它 能 表示 更 大 范 
围 的 数 。 
在 十 进 制 中 ， 一 个 数 可 以 写成 多 种 表示 形式 。 例 如 ，83.125 可 写成 103X 0.083125 或 
104X0.0083125 等 。 同样 , 一 个 二 进 制 数 也 可 以 写成 多 种 表示 形式 。 例 如， 二进制 数 1011.10101 
可 以 写成 24X0.101110101、25X0.0101110101 或 2X0.00101110101 等 。 由 此 可 知 ， 一 个 二 进 
制 数 N 可 以 表示 为 更 一 般 的 形式 N=2<XF， 其 中 五 称 为 阶 码 , 下 叫 作 尾数 。 用 阶 码 和 尾数 表示 
的 数 叫 作 浮 点 数 ， 这 种 表示 数 的 方法 称 为 浮 点 表示 法 。 

在 浮 点 表示 法 中 ， 阶 码 通常 为 带 符号 的 纯 整 数 ， 尾 数 为 带 符号 的 纯 小 数 。 浮 点 数 的 表示 格 
式 如 下 : 


[ 阶 符 | 阶 码 | 数 符 | 尾数 
很 明显 ， 一 个 数 的 浮 点 表示 不 是 唯一 的 。 当 小 数 点 的 位 置 改变 时 ， 阶 码 也 随 着 相应 改变 ， 
因此 可 以 用 多 种 浮 点 形式 表示 同一 个 数 。 
1) 规格 化 
浮 点 数 所 能 表示 的 数值 范围 主要 由 阶 码 决定 ， 所 表示 数值 的 精度 则 由 尾数 决定 。 为 了 充分 
尾数 来 表示 更 多 的 有 效 数字 ， 通 常 采用 规格 化 浮 点 数 。 规 格 化 就 是 将 尾数 的 绝对 值 限定 在 
间 [0.5, 1]。 当 尾数 用 补 码 表示 时 ， 需 要 注意 如 下 问题 。 


区 尝 
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@ 车 尾数 M 宇 0， 则 其 规格 化 的 尾数 形式 为 M==0.1X X X…X，, 其 中 X 可 为 0, 也 可 为 1， 
即将 尾数 限定 在 区 间 [0.5, 1) 。 

@ 若 尾 数 M<0,， 则 其 规格 化 的 尾数 形式 为 M=1.0X XXX…X， 其 中 X 可 为 0, 也 可 为 1， 
即将 尾数 M 的 范围 限定 在 区 间 [-1, -0.5]。 

如 果 浮 点 数 的 阶 码 ( 包 括 1 位 阶 符 》 用 R 位 的 移 码 表示 ， 尾 数 〈 包 括 1 位 数 符 ) 用 M 位 
的 补 码 表 示 ， 则 这 种 浮 点 数 所 能 表示 的 数值 范围 如 下 。 

最 大 的 正 数 ，+( -2-%+0 x 22” -0 ， 最 小 的 负数 ， -1 X 2 四 

2) IEEE 754 浮 点 格式 

IEEE 754 是 由 IEEE 制定 的 有 关 浮 点 数 表 示 的 工业 标准 ， 被 广泛 采用 。 该 标准 的 表示 形式 
如 下 : 


(CD525 (bobbyby…b, 1) 
其 中 ，(-1) 为 该 浮 点 数 的 数 符 ， 当 5 为 0 时 表示 正 数 ，5 为 1 时 表示 负数 ; 为 指数 ( 阶 码 ) ， 
用 移 码 表示 ， (bbbb…b, 1 ) 为 尾数 ， 其 长 度 为 尸 位 ， 用 原 码 表示 。 


目前 ， 计 算 机 中 主要 使 用 三 种 形式 的 IEEE 754 浮 点 数 ， 如 表 1-2 所 示 。 
表 1-2 三 种 形式 的 IEEE 754 浮 点 数 格式 


参 。 数 双 精 度 浮 点 数 扩充 精度 浮 点 数 
浮 点 数字 长 | 64 80 
尾数 长 度 P 52 64 
符号 位 5 | | 1 1 
指数 长 度 妃 | 8 | 11 15 
最 大 指数 +1023 +16383 
最 小 指数 -1022 -16382 
指数 偏 移 量 +127 +1023 +16383 
可 表示 的 实数 范 103 ~ 10 103% ~ 10" 107%2 一 1099 


根据 IEEE 754 标准 ， 被 编码 的 值 分 为 三 种 不 同 的 情况 : 规格 化 的 值 、 非 规格 化 的 值 和 特 
殊 值 ， 规 格 化 的 值 为 最 普遍 的 情形 。 

(1) 规格 化 的 值 

当 阶 码 部 分 的 二 进 制 值 不 全 为 0 也 不 全 为 1 时 ， 所 表示 的 是 规格 化 的 值 。 例 如 ， 在 单 精度 
浮 点 格式 下 ， 阶 码 为 10110011 时 ， 偏 移 量 为 +127 (01111111〉， 则 其 表示 的 真 值 为 
10110011-01111111=00110100， 转 换 为 十 进 制 后 为 52。 

对 于 尾数 部 分 ， 由 于 约定 小 数 点 左边 隐 含 有 一 位 ， 通 常 这 位 数 就 是 1， 因 此 单 精度 浮 点 数 
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尾数 的 有 效 位 数 为 24 位 , 即 尾数 为 1.X X…X .也 就 是 说 ,不 溢出 的 情况 下 尾数 M 的 值 在 1<M<2 
之 中 ， 这 是 一 种 获得 一 个 额外 精度 位 的 表示 技巧 。 

例如 ， 单 精度 浮 点 数 格式 下 ，bob,…b,, = 01001001100010001001011 时 ， 其 对 应 的 尾数 真 值 
为 1+2?2+25+23+23+233+227+220+222+233 即 尾数 的 真 值 为 1.28724038600921630859375 
(在 程序 中 以 十 进 制 方式 输出 时 ， 由 于 精度 的 原因 不 能 完全 给 出 此 值 ) 。 

【 例 1.5】 利用 IEEE 754 标准 将 数 176.0625 表示 为 单 精 度 浮 点 数 。 

解 : 首先 将 该 十 进 制 转换 成 二 进 制 数 。 

(176.0625),, =(10110000.0001), 

其 次 对 二 进 制 数 进行 规格 化 处 理 : 10110000.0001=1C01100000001X27。 这 就 保证 了 使 bo 
为 1， 而 且 小 数 点 应 当 在 今 位 置 上 。 将 bo 去 掉 并 扩展 为 单 精度 浮 点 数 所 规定 的 23 位 尾数 
01100000001000000000000。 

然后 求 阶 码 ， 上 述 表 示 中 的 指数 为 7， 而 单 精度 浮 点 数 规定 指数 的 偏 移 量 为 127〈 注 意 ， 
不 是 前 面 移 码 描述 中 所 提 到 的 128) ， 即 在 指数 7 上 加 127。 那 么 ，E=7 十 127 王 134， 则 指数 
的 移 码 表示 为 10000110。 

最 后 ， 可 得 到 (176.0625)io 的 单 精度 浮 点 数 表 示 形 式 : 

0 10000110 01100000001000000000000 

(2) 非 规格 化 的 值 
当 阶 码 部 分 的 二 进 制 值 全 为 0 时 ， 所 表示 的 数 是 非 规格 化 的 。 在 这 种 情况 下 ， 指 数 的 真 值 
为 1- 偏 移 量 〈 对 于 单 精度 浮 点 数 为 -126， 对 于 双 精 度 浮 点 数 为 -1022) ， 尾 数 的 值 就 是 二 进 制 
形式 对 应 的 小 数 ， 不 包含 隐 含 的 1。 

非 规格 化 数 有 两 个 用 途 : 一 是 用 来 表示 数值 0， 二 是 表示 那些 非常 接近 于 0 的 数 。 因 为 在 
规格 化 表示 方式 下 ， 必 须 使 尾数 大 于 等 于 1， 因 此 不 能 表示 出 0。 实 际 上 ，+0.0 的 浮 点 表示 是 
符号 、 阶 码 和 尾数 的 二 进 制 表 示 都 全 为 0。 需 要 注意 的 是 ， 符 号 位 为 1 而 阶 码 和 尾数 部 分 全 为 
0 时 表示 -0.0。 也 就 是 说 ，+0.0 和 -0.0 在 浮 点 表示 时 有 所 不 同 。 

(3) 特殊 值 

当 阶 码 部 分 的 二 进 制 值 全 为 1 时 ， 表 示 特 殊 的 值 。 当 尾数 部 分 全 部 为 0 时 表示 无 穷 大 ， 符 
号 位 为 0 时 表示 +ce， 当 符号 位 为 1 时 表示 -ce 。 当 浮 点 运算 溢出 时 ， 用 无 穷 来 表示 。 当 尾数 部 
分 不 全 为 0 时 ， 称 为 “NaN”， 即 “不 是 一 个 数 ”。 当 运算 结果 不 是 实数 或 者 无 穷 ， 就 表示 为 
NaN。 

3) 浮 点 数 的 运算 

设 有 浮 点 数 了 =M X2， 了 = NX2， 求 XH7 的 运算 过 程 要 经 过 对 阶 、 求 尾数 和 (〈 差 ) 、 
结果 规格 化 并 判 溢出 、 舍 入 处 理 和 溢出 判别 等 步骤 。 
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@ 对 阶 。 使 两 个 数 的 阶 码 相 同 。 令 K=|ij|， 把 阶 码 小 的 数 的 尾数 右 移 K 位 ， 使 其 阶 码 加 
上 kK, 

@ 求 尾数 和 《〈 差 ) 。 

@ 结果 规格 化 并 判 溢 出 。 若 运算 结果 所 得 的 尾数 不 是 规格 化 的 数 ， 则 需要 进行 规格 化 处 
理 。 当 尾数 溢出 时 ， 需 要 调整 阶 码 。 

@ 舍 入 。 在 对 结果 右 规 时 ， 尾 数 的 最 低位 将 因 移 出 而 丢掉 。 另 外 ， 在 对 阶 过 程 中 也 会 将 
尾数 右 移 使 最 低位 丢掉 。 这 就 需要 进行 舍 入 处 理 ， 以 求 得 最 小 的 运算 误差 。 

@ 溢出 判别 。 以 阶 码 为 准 ， 若 阶 码 溢出 ， 则 运算 结果 溢出 ; 若 阶 码 下 溢 〈 小 于 最 小 值 ) ， 
则 结果 为 0， 否 则 结果 正确 无 溢出 。 

浮 点 数 相 乘 ， 其 积 的 阶 码 等 于 两 乘 数 的 阶 码 相 加 ， 积 的 尾数 等 于 两 乘 数 的 尾数 相 乘 。 浮 点 
数 相 除 ， 其 商 的 阶 码 等 于 被 除数 的 阶 码 减 去 除数 的 阶 码 ， 商 的 尾数 等 于 被 除数 的 尾数 除 以 除数 
的 尾数 。 乘 除 运算 的 结果 都 需要 进行 规格 化 处 理 并 判断 阶 码 是 否 溢出 。 


3， 校 验 码 


计算 机 系统 运行 时 ， 各 个 部 件 之 间 要 进行 数据 传输 和 交换 ， 为 了 确保 数据 在 传送 过 程 中 ] 
确 无 误 ， 一 是 提高 硬件 电路 的 可 靠 性 ， 二 是 提高 代码 的 校 验 能 力 ， 包 括 查 错 和 纠 错 。 通 常 使 
校 验 码 来 检测 传送 的 数据 是 否 出 错 ， 其 基本 思想 是 把 数据 可 能 出 现 的 编码 分 为 两 类 : 合法 编码 
和 错误 编码 。 合 法 编码 用 于 传送 数据 ， 错 误 编码 是 不 允许 在 合法 数据 中 出 现 的 编码 。 合 理 地 设 
计 错 误 编码 以 及 编码 规则 ， 使 得 数据 在 传送 中 出 现 某 种 错误 时 就 会 变 成 错误 编码 ， 这 样 就 可 以 
检测 出 接收 到 的 数据 是 否 有 错 。 

所 谓 码 距 , 是 指 一 个 编码 系统 中 任意 两 个 合法 编码 之 间 至 少 有 多 少 个 二 进 制 位 不 同 。 例 如 ， 
4 位 8421 码 的 码 距 为 1， 在 传输 过 程 中 ， 该 代码 的 一 位 或 多 位 发 生 错 误 ， 都 将 变 成 另外 一 个 合 
法 编码 ， 因 此 这 种 代码 无 检 错 能 力 。 下 面 简 要 介绍 常用 的 三 种 校 验 码 : 奇偶 校 验 码 、 海 明码 和 
循环 匈 余 校 验 码 。 

1) 奇偶 校 验 码 (Parity Codes) 

奇偶 校 验 是 一 种 简单 有 效 的 校 验方 法 。 这 种 方法 通过 在 编码 中 增加 一 位 校 验 位 来 使 编码 中 
1 的 个 数 为 奇数 〈 奇 校 验 ) 或 者 为 偶数 〈 偶 校 验 ) ， 从 而 使 码 距 变 为 2。 对 于 奇 ( 或 偶 ) 校 验 ， 
它 可 以 检测 代码 中 奇数 位 出 错 的 编码 ， 但 不 能 发 现 偶数 位 出 错 的 情况 ， 即 当 合 法 编码 中 奇数 位 
发 生 了 错误 ， 即 编码 中 的 1 变 成 0 或 0 变 成 1， 则 该 编码 中 1 的 个 数 的 奇偶 性 就 发 生 了 变化 ， 
从 而 可 以 发 现 错误 。 

常用 的 奇偶 校 验 码 有 三 种 : 水 平 奇偶 校 验 码 、 垂 直 奇 偶 校 验 码 和 水 平 垂直 校 验 码 。 

2) 海 明 码 (Hamming Code) 

海 明 码 是 由 贝尔 实验 室 的 Richard Hamming 设计 的 ， 它 是 利用 奇偶 性 来 检 错 和 纠 错 的 校 验 


击败 
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方法 。 海 明码 的 构成 方法 是 : 在 数据 位 之 间 插 入 大 个 校 验 位 ， 通 过 扩大 码 距 来 实现 检 错 和 
纠 错 。 
设 数据 位 是 位 ， 校 验 位 是 位 ， 则 n 和 必须 满足 以 下 关系 : 


2:—1>n+k 
大 常 取 满足 该 关系 的 最 小 值 。 
海 明 码 的 编码 规则 如 下 。 
设 大 个 校 验 位 为 Pr，Pk 1，…，P1，n 个 数据 位 为 D 1，D, ，，…，D1，Do， 对 应 的 海 明 码 
为 He Hael，…，HI， 那 么 : 


(1) Pi 在 海 明 码 的 第 2 站 位 置 ， 即 H=Pi， 且 大 2 站 ; 数据 位 则 依 序 从 低 到 高 占据 海 明 码 中 
剩 下 的 位 置 。 
(2) 海 明 码 中 的 任 一 位 都 是 由 若干 个 校 验 位 来 校 验 的 。 其 对 应 关系 如 下 : 被 校 验 的 海 明 位 
的 下 标 等 于 所 有 参与 校 验 该 位 的 校 验 位 的 下 标 之 和 ， 而 校 验 位 则 由 自身 校 验 。 
对 于 8 位 的 数据 位 ， 进 行 海 明 校 验 需 要 4 个 校 验 位 《2 汪 1=7, 2 和 -1=15>8+4) 。 令 数据 位 为 
D;:，De，Ds，D4，D3，D，,，D1，Do， 校 验 位 为 PJ，P3，P，,，，P1， 形 成 的 海 明 码 为 Hl,，H11，…， 
H3，H2，H1， 则 编码 过 程 如 下 。 
(1) 确定 D 与 P 在 海 明 码 中 的 位 置 ， 如 下 所 示 : 
Hz Hn Ho Ho Hs H He Hs H Hi H H 
D: De D: D: Ps D3; D, D: Pi Du P, Pi 
(2) 确定 校 验 关系 ， 如 表 1-3 所 示 。 


表 1-3 海 明 码 的 校 验 关系 表 


海 明 码 海 了 明码 的 下 标 说 明 〈 偶 校 验 ) 
Hi (P1) 1 
了 5 Pi1 校 验 : Pl、Do、Di、D3、Ds、Ds 
即 P=Doe@DI@D;@D:@D 
Hs (Do) 3=142 1= Do@ D1@ D3@ Di@ Ds 
Hi 4 
站 a P; 校 验 : P,、Do、D;、D;3、Ds、Ds 
一 一 即 P=Doe@eDe@D;e@Di@Ds 
Hse (D;) 6=2+4 
= 1+2+ 
HD;) 了 PPa ,Ps P; 校 验 : P;:、Di、D,、D;、D， 
Hs Ps) . Pa 即 Ps=Di@D,@D;@D’ 
Hs (D;) 9=1+8 Pr, Ps 
Hi (D3) 10=218 PP Ps 校 验 : Ps、Ds、D;、De、D; 
Hu (De) 11 = 1+2+8 Pi,P,, 即 P= Ds@ Ds@ De@D; 
Hi, (D7) 12=4+8 Py;P4 
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若 采 用 奇 校 验 ， 则 将 各 校 验 位 的 偶 校 验 值 取 反 即 可 。 

(3) 检测 错误 。 对 使 用 海 明 编码 的 数据 进行 差错 检测 很 简单 ， 只 需 作 以 下 计算 : 

G1=P1® Do@ Di®@ D;3@® D1@ Ds 

G;=P,® Do® D;@® D;3@® Ds@ Ds 

G3=P3@ Di® D,@ D3@D’ 

G4=Pi1® D1®@ D;@ De@D; 

若 采 用 偶 校 验 ， 则 G4G3G2G; 全 为 0 时 表示 接收 到 的 数据 无 错误 〈 奇 校 验 则 应 全 为 1) 。 
当 G4G3G2G; 不 全 为 0 说 明 发 生 了 差错 ， 而 且 G4G3G2G 的 十 进 制 值 指出 了 发 生 错 误 的 位 置 ， 例 
如 G4G3G2Gi=1010， 说 明 Hio(Ds) 出 错 了 ， 将 其 取 反 即 可 纠正 错误 。 

【 例 1.6】 设 数据 为 01101001， 试 采用 4 个 校 验 位 求 其 偶 校 验 方式 的 海 明 码 。 

解 : D7DsD:D4D3D:DiDu=01101001， 根 据 公式 

PI1=Do@DI@D3®@ Di@ Dec=1®@0@1®@80@1=1 

P=Do@ D,@ D3@ D;@ De=1®@80@81@1@1=0 

P=DI@D.@ D3®@ D1/=0@®0@1@®@0=1 

Ps=Dis®@ D;@ De@D;:=0®@81@®@1®@0=0 

因此 ， 求 得 的 海 明 码 为 : 

Hs Hy Ho Ho Hs H He Hs Hi H H HH 

D De D: D: P pp D, D P; Do P, Pi 

0 1 | 0 0 1 0 0 1 1 0 1 


3) 循环 元 余 校 验 码 (Cyclic Redundancy Check，CRC) 
循环 兄 余 校 验 码 广泛 应 用 于 数据 通信 领域 和 磁 介 质 存储 系统 中 。 它 利用 生成 多 项 式 为 大 个 
数据 位 产生 > 个 校 验 位 来 进行 编码 ， 其 编码 长 度 为 ttr。CRC 的 代码 格式 为 : 


n nl rtl A Lm | 2 1 


数据 位 校 验 位 


由 此 可 知 ， 循 环 见 余 校 验 码 是 由 两 部 分 组 成 的 ， 左 边 为 信息 码 数据) ， 右 边 为 校 验 码 。 
车 信息 码 占 位 ， 则 校 验 码 就 占 nk 位 。 其 中 ，n 为 CRC 码 的 字 长 ， 所 以 又 称 为 (n，k) 码 。 
校 验 码 是 由 信息 码 产 生 的 ， 校 验 码 位 数 越 长 ， 该 代码 的 校 验 能 力 就 越 强 。 在 求 CRC 编码 时 ， 
采用 的 是 模 2 运算 。 模 2 运算 加 减 运算 的 规则 是 按 位 运算 ， 不 发 生 借 位 和 进位 。 
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1.2 ”计算 机 体系 结构 


1.2.1 概述 


计算 机 系统 结构 (Computer Architecture) 是 指 计算 机 的 概念 性 结构 、 功 能 和 性 能 特性 ， 它 
从 一 个 更 高 的 层次 对 计算 机 的 结构 和 特征 等 宏观 特性 进行 研究 。 这 里 简要 介绍 其 分 类 以 及 
CISC、RISC、 流 水 线 、 并 行 处 理 等 概念 。 


1. 计算 机 体系 结构 分 类 


(1) 宏观 上 按 处 理 机 的 数量 进行 分 类 ， 分 为 单 处 理 系统 、 并 行 处 理 与 多 处 理 系统 和 分 布 式 
处 理 系 统 。 
。 ” 单 处 理 系 统 〔Uniprocessing System) 。 利 用 一 个 处 理 单元 与 其 他 外 部 设备 结合 起 来 ， 
实现 存储 、 计 算 、 通 信 、 输 入 与 输出 等 功能 的 系统 。 
。 ”并 行 处 理 与 多 处 理 系统 Parallel Processing and Multiprocessing System) 。 为 了 充分 发 
挥 问题 求解 过 程 中 处 理 的 并 行 性 , 将 两 个 以 上 的 处 理 机 互 连 起 来 , 彼此 进行 通信 协调 ， 
以 便 共同 求解 一 个 大 问题 的 计算 机 系统 。 
。 分布 式 处 理 系 统 (Distributed Processing System) 。 指 物理 上 远 距 离 而 松 耦合 的 多 计算 
机 系统 。 其 中 ， 物 理 上 的 远 距离 意味 着 通信 时 间 与 处 理 时 间 相 比 已 不 可 忽略 ， 在 通信 
线路 上 的 数据 传输 速率 要 比 在 处 理 机 内 部 总 线 上 传输 慢 得 多 , 这 也 正 是 松 耦 合 的 含义 。 
(2) 微观 上 按 并 行程 度 分 类 ， 有 Flynn 分 类 法 、 冯 泽 云 分 类 法 、Handler 分 类 法 和 Kuck 分 
。 Flynn 分 类 法 。1966 年 ，M.J.Flynn 提出 按 指 令 流 和 数据 流 的 多 少 进行 分 类 。 指 令 流 为 
机 器 执行 的 指令 序列 ， 数 据 流 是 由 指令 调用 的 数据 序列 。Flynn 把 计算 机 系统 的 结构 
分 为 单 指令 流 单 数据 流 (Single Instruction stream Single Data stream，SISD) 、 单 指令 
流 多 数据 流 〈Single Instruction stream Multiple Data stream，SIMD) 、 多 指令 流 单 数据 
流 (Multiple Instruction stream Single Data stream, MISD) 和 多 指令 流 多 数据 流 (Multiple 
Instruction stream Multiple Data stream，MIMD) 4 类。 
。 汉 泽 云 分 类 法 。1972 年 ， 美 籍 华人 冯 泽 云 (Tse-yun Feng) 提出 按 并 行 度 对 各 种 计算 
机 系统 进行 结构 分 类 。 所 谓 最 大 并 行 度 ， 是 指 计算 机 系统 在 单位 时 间 内 能 够 处 理 的 最 
大 二 进 制 位 数 。 汉 泽 云 把 计算 机 系统 分 成 字 串 行 位 串 行 (WSBS) 计算 机 、 字 并 行 位 
串 行 (WPBS) 计算 机 、 字 串 行 位 并 行 (WSBP) 计算 机 和 字 并 行 位 并 行 (WPBP) 计 
算 机 4 类 。 
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。 Handler 分 类 法 。1977 年 ， 德 国 的 汉 德 勒 (Wolfgang Handler) 提出 一 个 基于 硬件 并 行 

程度 计算 并 行 度 的 方法 ， 把 计算 机 的 硬件 结构 分 为 三 个 层次 : 处 理 机 级 、 每 个 处 理 机 
中 的 算 逻 单元 级 、 每 个 算 逻 单元 中 的 逻辑 门 电路 级 。 分 别 计算 这 三 级 中 可 以 并 行 或 流 
水 处 理 的 程序 ， 即 可 算出 某 系 统 的 并 行 度 。 
。 Kuck 分 类 法 。1978 年 ,美国 的 库 克 (David J.Kuck) 提出 与 Flynn 分 类 法 类 似 的 方法 ， 
指令 流 和 执行 流 (Execution Stream) 及 其 多 重 性 来 描述 计算 机 系统 控制 结构 的 特征 。 
Kuck 把 系统 结构 分 为 单 指令 流 单 执行 流 〈SISE) 、 单 指令 流 多 执行 流 (SIME) 、 多 
指令 流 单 执行 流 (MISE) 和 多 指令 流 多 执行 流 (MIME) 4 类 。 


2. CISC 和 RISC 


一 个 处 理 器 支持 的 指令 和 指令 的 字 节 级 编码 称 为 其 指令 集体 系 结构 (Instruction Set 
Architecture，ISA) ， 不 同 的 处 理 器 族 支持 不 同 的 指令 集体 系 结构 ， 因 此 ， 一 个 程序 被 编译 在 
一 种 机 器 上 运行 ， 就 不 能 在 另 一 种 机 器 上 运行 。CISC 和 RISC 是 指令 集体 系 结构 发 展 的 两 个 
途径 。 

(1) CISC (Complex Instruction Set Computer， 复 杂 指 令 集 计 算 机 ) 的 基本 思想 是 进一步 增 
强 原 有 指令 的 功能 ， 用 更 为 复杂 的 新 指令 取代 原先 由 软件 子 程序 完成 的 功能 ， 实 现 软件 功能 的 
硬化 ， 导 致 机 器 的 指令 系统 越 来 越 庞大 而 复杂 。 微 处 理 器 x86 的 体系 结构 属于 CISC 类 型 。 

CISC 的 主要 次 病 如 下 。 

Q@ 指令 集 过 分 庞杂 。 

@ 微 程序 技术 是 CISC 的 重要 支柱 , 每 条 复杂 指令 都 要 通过 执行 一 段 解 释 性 微 程序 才能 完 
成 ， 这 就 需要 多 个 CPU 周期 ， 从 而 降低 了 机 器 的 处 理 速 度 。 

@ 由 于 指令 系统 过 分 庞大 ， 使 高 级 语言 编译 程序 选择 目标 指令 的 范围 很 大 ， 并 使 编译 程 
序 本 身 宛 长 而 复杂 ， 从 而 难以 优化 编译 使 之 生成 真正 高 效 的 目标 代码 。 

@ CISC 强调 完善 的 中 断 控制 ， 势 必 导 致 动作 繁多 ， 设 计 复杂 ， 研 制 周期 长 。 

@ CISC 给 芯片 设计 带 来 很 多 困难 ， 使 芯片 种 类 增多 ， 出 错 几 率 增 大 ， 成 本 提高 而 成 品 率 
降低 。 

(2) RISC (Reduced Instruction Set Computer， 精 简 指令 集 计 算 机 ) 的 基本 思想 是 通过 减少 
指令 总 数 和 简化 指令 功能 ， 降 低 硬 件 设计 的 复杂 度 ， 使 指令 能 单 周期 执行 ， 并 通过 优化 编译 ， 
提高 指令 的 执行 速度 ， 采 用 硬 线 控制 逻辑 ， 优 化 编译 程序 ， 导 致 机 器 的 指令 系统 进一步 精炼 而 
简单 。ARM 处 理 器 属于 RISC。 

RISC 的 关键 技术 如 下 。 

@ 重生 寄存 器 窗口 技术 .在 伯克利 的 RISC 项 目 中 首先 采用 了 重 释 寄存 器 窗口 (Overlapping 
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Register Windows) 技术 。 其 基本 思想 是 在 处 理 机 中 设置 一 个 数量 比较 大 的 寄存 器 堆 ， 并 把 它 划 
分 成 很 多 个 窗口 。 每 个 过 程 使 用 其 中 相 邻 的 3 个 窗口 和 一 个 公共 的 窗口 ， 而 在 这 些 窗口 中 有 一 
个 窗口 是 与 前 一 个 过 程 共用 ， 还 有 一 个 窗口 是 与 下 一 个 过 程 共用 的 。 与 前 一 过 程 共用 的 窗口 可 
以 用 来 存放 前 一 过 程 传送 给 本 过 程 的 参数 ， 同 时 也 存放 本 过 程 传送 给 前 一 过 程 的 计算 结果 。 同 
样 ， 与 下 一 过 程 共用 窗口 可 以 用 来 存放 本 过 程 传送 给 下 一 过 程 的 参数 和 存放 下 一 过 程 传送 给 本 
过 程 的 计算 结果 。 

@ 优化 编译 技术 。RISC 使 用 了 大 量 的 寄存 器 ， 如 何 合理 分 配 寄 存 器 、 提 高 寄存 器 的 使 用 
效率 及 减少 访 存 次 数 等 ， 都 应 通过 编译 技术 的 优化 来 实现 。 

@ 将 流水 及 超标 量 技术 。 为 了 进一步 提高 流水 线 速度 而 采用 的 技术 。 

@ 硬 布线 逻辑 与 微 程序 相 结合 在 微 程序 技术 中 。 


3， 流水 线 技术 


te fort te er a pled 处 理 时 间 大 致 相等 的 子 过 
程 ， 每 个 个 独立 的 功能 部 件 来 完成 ， 处 理 对 象 在 各 子 过 程 连 成 的 线路 上 连续 流动 ， 
在 同一 时 间 ， ea 完成 对 不 同 对 象 的 处 理 。 

流水 处 理 技术 是 在 重 琶 、 先 行 控制 方式 的 基础 上 发 展 起 来 的 。 

(1) 指令 控制 方式 。 指 令 控 制 方式 有 顺序 方式 、 重 登 方 式 和 流水 方式 三 种 。 

@ 顺序 方式 。 顺 序 方式 是 指 各 机 器 指令 之 间 顺 序 串 行 地 执行 ， 执 行 完 一 条 指令 后 才 取 下 
一 条 指令 ， 而 且 每 条 机 器 指令 内 部 的 各 个 微 操 作 也 是 顺序 串 行 地 执行 。 这 种 方式 的 优点 是 控制 
简单 。 缺 点 是 速度 慢 ， 各 部 件 的 利用 率 低 。 

@ 重 登 方式 。 重 登 方 式 是 指 在 解释 第 天 条 指令 的 操作 完成 之 前 ， 就 开始 解释 第 K+1 条 指 
令 ， 如 图 1-2 所 示 。 通 常 采用 的 是 一 次 重合 ， 即 在 任何 时 候 ， 指 令 分 析 部 件 和 指令 执行 部 件 都 
只 有 相 邻 两 条 指令 在 重合 解释 。 这 种 方式 的 优点 是 速度 有 所 提高 ， 控 制 也 不 太 复杂 。 缺 点 是 会 
出 现 冲突 、 转 移 和 相关 等 问题 ， 在 设计 时 必须 想 办 法 解决 。 


分 析 指令 天 执行 指令 


分 析 指令 K+1 | 执行 指令 K+1 | 


图 1-2 ”一 次 重 麦 处理 


@ 流水 方式 。 流 水 方式 是 模仿 工业 生产 过 程 的 流水 线 〈 如 汽车 装配 线 ) 而 提出 的 一 种 指 
令 控制 方式 。 流 水 Pipe Lining) 技术 是 把 并 行 性 或 并 发 性 嵌入 到 计算 机 系统 里 的 一 种 形式 ， 
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它 把 重复 的 顺序 处 理 过 程 分 解 为 若干 子 过 程 ， 每 个 子 过 程 能 在 专用 的 独立 模块 上 有 效 地 并 发 工 


作 ， 如 图 1-3 所 示 。 


空间 


执行 


取 操作 数 


指令 译 码 


取 指令 


nn hh hb & & tf t tt 时 间 


图 1-3 流水 处 理 的 时 空 图 


在 概念 上 ，“ 流 水 ”可 以 看 成 是 “重合 ”的 延伸 。 差 别 仅 在 于 “一 次 重合 ”只 是 把 一 条 指 


令 解释 分 解 为 两 个 子 过 程 ， 而 “流水 ” 则 是 分 解 为 更 多 的 子 过 程 。 
(2) 流水 线 的 种 类 。 
@ 从 级 别 角 度 可 分 为 部 件 级 、 处 理 机 级 以 及 系统 级 的 流水 线 。 
@ 从 功能 角度 可 分 为 单 功能 流水 线 和 多 功能 流水 线 。 
@ 从 联接 方式 上 可 分 为 静态 流水 线 和 动态 流水 线 。 
@ 从 流水 线 是 否 有 反馈 回路 ， 可 分 为 线性 流水 线 和 非 线 性 流水 线 。 
@ 从 流水 线 的 流动 顺序 上 ， 可 分 为 同步 流水 线 和 异步 流水 线 。 
@ 从 流水 线 的 数据 表示 上 ， 可 分 为 标量 流水 线 和 向 量 流水 线 。 
(3) 流水 的 相关 处 理 。 


可 


由 于 流水 时 机 器 同时 解释 多 条 指令 , 可 能 存在 对 同一 主 存单 元 或 同一 寄存 器 的 “ 先 写 后 读 ” 
的 要 求 ， 这 时 就 出 现 了 相关 。 这 种 相关 包括 指令 相关 、 访 存 操作 数 相 关 以 及 通用 寄存 器 组 相关 
等 ， 它 只 影响 相关 的 两 条 或 几 条 指令 ， 而 且 至 多 影响 流水 线 的 某 些 段 推 后 工作 ， 并 不 会 改动 指 
令 缓冲 器 中 预 取 到 的 指令 内 容 ， 影 响 是 局 部 的 ， 所 以 称 为 局 部 性 相关 。 解 决 局 部 性 相关 有 推 后 


法 和 通路 法 两 种 方法 。 推 后 法 是 推 后 对 相关 单元 的 读 ， 直 至 写 入 完成 。 通 路 法 设置 相关 专 


通 


路 ， 使 得 不 必 先 把 运算 结果 写 入 相关 存储 单元 ， 再 从 这 里 读 出 后 才能 使 用 ， 而 是 经 过 相关 专用 


通路 直接 使 用 运算 结果 ， 以 加 快速 度 。 


转移 指令 (尤其 是 条 件 转移 指令 ) 与 它 后 面 的 指令 之 间 存 在 关联 ， 使 之 不 能 同时 解释 。 


执 


行 转移 指令 时 ， 可 能 会 改动 指令 缓冲 器 中 预 取 到 的 指令 内 容 ， 从 而 会 造成 流水 线 知 吐 率 和 效率 


下 降 ， 比 局 部 性 相关 的 影响 要 严重 得 多 ， 所 以 称 为 全 局 性 相关 。 
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解决 全 局 性 相关 有 三 种 方法 : 猜测 转移 分 支 、 加 快 和 提前 形成 条 件 码 、 加 快 短 循环 程序 的 
处 理 。 
条 件 转移 指令 的 两 个 分 支 中 ， 一 个 分 支 是 按 原 来 的 顺序 继续 执行 下 去 ， 称 为 转移 不 成 功 分 
支 ; 另 一 个 分 支 是 按 转 移 后 的 新 指令 序列 执行 ， 称 为 转移 成 功 分 支 。 许 多 流水 机 器 都 猜 选 转移 
不 成 功 分 支 ， 若 猜 对 的 几率 很 大 ， 流 水 线 的 吞吐 率 和 效率 就 会 比 不 采用 猜测 法 时 高 得 多 。 

尽早 获得 条 件 码 以 便 对 流水 线 简化 条 件 转移 的 处 理 。 例 如 ， 一 个 乘法 运算 所 需 时 间 较 长 ， 
但 在 运算 之 前 就 能 知道 其 结果 为 正 或 为 负 ， 或 者 是 否 为 0， 因 此 ， 加 快 单条 指令 内 部 条 件 码 的 
形成 ， 或 者 在 一 段 程序 内 提前 形成 条 件 码 ， 对 转移 问题 的 顺利 解决 是 很 有 好 处 的 。 
由 于 程序 中 广泛 采用 循环 结构 ， 因 此 流水 线 大 都 采用 特殊 措施 以 加 快 循环 程序 的 处 理 。 例 
如 ， 使 整个 循环 程序 都 放 入 指令 缓冲 存储 器 中 ， 对 提高 流水 效率 和 吞吐 率 均 有 明显 效果 。 流 水 
的 中 断 处 理 和 转移 一 样 ， 也 会 引起 流水 线 断 流 。 一 般 情 况 下 ， 中 断 出 现 的 概率 要 比 条 件 转移 出 
现 的 概率 低 得 多 ， 因 此 只 要 处 理 好 断 点 现场 保护 及 中 断后 的 恢复 ， 尽 量 缩短 断 流 时 间 即 可 。 

RISC 中 采用 的 流水 技术 有 三 种 : 超 流水 线 、 超 标量 以 及 超 长 指令 字 。 

@ 超 流水 线 技术 。 超 流水 线 (Super Pipeline) 技术 是 RISC 采用 的 一 种 并 行 处 理 技术 。 它 
通过 细 化 流水 、 增 加 级 数 和 提高 主 频 ， 使 得 在 每 个 机 器 周期 内 能 完成 一 个 甚至 两 个 浮 点 操作 。 
其 实质 是 以 时 间 换 取 空 间 。 超 流水 机 器 的 特征 是 在 所 有 的 功能 单元 都 采用 流水 ， 并 有 更 高 的 时 
钟 频率 和 更 深 的 流水 深度 。 由 于 它 只 限于 指令 级 的 并 行 , 所 以 超 流水 机 器 的 CCPI (Clock Cycles 
Per Instruction， 每 个 指令 需要 的 机 器 周期 数 ) 值 稍 高 。 

@ 超标 量 技术 。 超 标量 (Super Scalar) 技术 是 RISC 采用 的 又 一 种 并 行 处 理 技术 ， 它 通过 
内 装 多 条 流水 线 来 同时 执行 多 个 处 理 ， 其 时 钟 频率 虽然 与 一 般 流 水 接近 ， 却 有 更 小 的 CCPI。 
其 实质 是 以 空间 换取 时 间 。 

@ 超 长 指令 字 技术 。 超 长 指令 字 〈Very Long Instruction Word，VLIW) 技术 由 LIW 发 展 
而 来 。VLIW 和 超标 量 都 是 20 世纪 80 年 代 出 现 的 概念 ， 其 共同 点 都 是 要 同时 执行 多 条 指令 ， 

其 不 同 在 于 超标 量 依 靠 硬件 来 实现 并 行 处 理 的 调度 ，VLIW 则 充分 发 挥 软件 的 作用 ， 而 使 硬件 
简化 ， 性 能 提高 。VLIW 有 更 小 的 CPI 值 ， 但 需要 有 足够 高 的 时 钟 频率 。 

(4) 吞吐 率 和 流水 建立 时 间 。 

吞吐 率 是 指 单位 时 间 里 流水 线 处 理 机 流出 的 结果 数 。 对 指令 而 言 ， 就 是 单位 时 间 里 执行 的 
指令 数 。 如 果 流 水 线 的 子 过程 所 用 时 间 不 一 样 ， 则 吞吐 率 p 应 为 最 长 子 过程 所 用 时 间 的 倒数 ， 
即 


p=1/max{At, At,,…, At,,} 


流水 线 开始 工作 ， 须 经 过 一 定时 间 才 能 达到 最 大 春 吐 率 ， 这 就 是 建立 时 间 。 若 加 个 子 过 程 
所 用 时 间 一 样 ， 均 为 At。， 则 建立 时 意 = mAn 。 
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4. 阵列 处 理 机 、 并 行 处 理 机 和 多 处 理 机 


并 行 性 包括 同时 性 和 并 发 性 两 个 侧面 。 其中， 同时 性 是 指 两 个 或 两 个 以 上 的 事件 在 同一 时 
刻 发 生 ， 并 发 性 是 指 两 个 或 两 个 以 上 的 事件 在 同一 时 间 间 隔 内 连续 发 生 。 

从 计算 机 信息 处 理 的 步骤 和 阶段 的 角度 看 ， 并 行 处 理 可 分 为 如 下 几 类 。 

@ 存储 器 操作 并 行 ; 

@ 处 理 器 操作 步骤 并 行 〈 流 水 线 处 理 机 ) ; 

@ 处 理 器 操作 并 行 〈 阵 列 处 理 机 ) ; 

图 指令 、 任 务 、 作 业 并 行 〈 多 处 理 机 、 分 布 处 理 系 统 、 计 算 机 网 络 ) 。 

(1) 阵列 处 理 机 

阵列 处 理 机 将 重复 设置 的 多 个 处 理 单元 (PU) 按 一 定 方式 连 成 阵列 , 在 单个 控制 部 件 (CU) 
控制 下 ， 对 分 配给 自己 的 数据 进行 处 理 ， 并 行 地 完成 一 条 指令 所 规定 的 操作 。 这 是 一 种 单 指令 
流 多 数据 流 计算 机 ， 通 过 资源 重复 实现 并 行 性 。 

(2) 并 行 处 理 机 

SIMD 和 MIMD 是 典型 的 并 行 计算 机 ，SIMD 有 共享 存储 器 和 分 布 存 储 器 两 种 形式 。 

具有 共享 存储 器 的 SIMD 结构 (如 图 1-4 所 示 ) 中， 将 若干 个 存储 器 构成 统一 的 并 行 处 理 
机 存储 器 ， 通 过 互联 网 络 ICN 为 整个 并 行 系统 的 所 有 处 理 单元 共享 。 其 中 ，PE 为 处 理 单元 ， 
CU 为 控制 部 件 ，M 为 共享 存储 器 ，ICN 为 互联 网 络 。 

分 布 式 存储 器 的 SIMD 处 理 机 如 图 1-5 所 示 ， 其 中 PE 为 处 理 单元 ，CU 为 控制 部 件 ，PEM 
为 局 部 存储 器 ，ICN 为 互联 网 络 。 含 有 多 个 同样 结构 的 处 理 单元 ， 通 过 寻 径 网 络 ICN 以 一 定 方 
式 互 相连 接 。 


PE0 PE1 PE 7-]1 Oe 


图 1-4 具有 共享 存储 器 的 SIMD 结构 图 1-5 具有 分 布 存储 器 的 SIMD 结构 
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分 布 存储 器 的 并 行 处 理 机 结构 中 有 两 类 存储 器 ， 一 类 存储 器 附属 于 主 处 理 机 ， 主 处 理 机 实 
现 整个 并 行 处 理 机 的 管理 ， 在 其 附属 的 存储 器 内 常 驻 操作 系统 。 另 一 类 是 分 布 在 各 个 处 理 单元 
上 的 存储 器 ( 即 PEM) ， 这 类 存储 器 用 来 保存 程序 和 数据 。 在 阵列 控制 部 件 的 统一 指挥 下 ， 实 
现 并 行 操作 。 程 序 和 数据 通过 主机 装 入 控制 存储 器 。 通 过 控制 部 件 的 是 单 指令 流 ， 所 以 指令 的 
执行 顺序 还 是 和 单 处 理 机 一 样 ， 基 本 上 是 串 行 处 理 。 指 令 送 到 控制 部 件 进行 译 码 。 划 分 后 的 数 
据 集合 通过 向 量 数据 总 线 分 布 到 所 有 PE 的 本 地 存储 器 PEM。PE 通过 数据 寻 径 网 络 互 连 。 数 据 
寻 径 网 络 执行 PE 间 的 通信 。 控 制 部 件 通过 执行 程序 来 控制 寻 径 网 络 。PE 的 同步 由 控制 部 件 的 
硬件 实现 。 

(3) 多 处 理 机 

多 处 理 机 系统 是 由 多 台 处 理 机 组 成 的 系统 ， 每 台 处 理 机 有 属于 自己 的 控制 部 件 ， 可 以 执行 
独立 的 程序 ， 共 享 一 个 主 存储 器 和 所 有 的 外 部 设备 。 它 是 多 指令 流 多 数据 流 计算 机 。 在 多 处 理 
机 系统 中 ， 机 间 的 互 连 技术 决定 着 多 处 理 机 的 性 能 。 多 处 理 机 之 间 的 互 连 ， 要 满足 高 频带 、 低 
成 本 、 连 接 方式 的 多 样 性 以 及 在 不 规则 通信 情况 下 连接 的 无 冲突 性 。 

(4) 其 他 计算 机 

集群 一 般 是 指 连接 在 一 起 的 两 个 或 多 个 计算 机 节点 ) 。 集 群 计算 机 是 一 种 并 行 或 分 布 式 
处 理 系统 ， 由 很 多 连接 在 一 起 的 独立 计算 机 组 成 ， 像 一 个 单 集成 的 计算 机 资源 一 样 协同 工作 ， 
主要 用 来 解决 大 型 计算 问题 。 计 算 机 节点 可 以 是 一 个 单 处 理 器 或 多 处 理 器 的 系统 ， 拥 有 内 存 、 
lO 设备 和 操作 系统 。 连 接 在 一 起 的 计算 机 集群 对 用 户 和 应 用 程序 来 说 像 一 个 单一 的 系统 ， 这 
样 的 系统 可 以 提供 一 种 价格 合理 且 可 获得 所 需 性 能 和 快速 而 可 靠 的 服务 的 解决 方案 。 

网 格 计算 是 伴随 着 因特网 技术 而 迅速 发 展 起 来 的 ， 专 门 用 于 复杂 科学 计算 的 新 型 计算 模 
式 。 这 种 计算 模式 是 利用 因特网 把 分 散在 不 同 地 理 位 置 的 计算 机 组 织 成 一 个 “虚拟 的 超级 计算 
机 ”， 其 中 每 台 参 与 计算 的 计算 机 就 是 一 个 “节点 ”， 整 个 计算 是 由 成 千 上 万 个 “节点 ”组 成 
的 “一 张 网 格 ”， 所 以 这 种 计算 方式 叫 网 格 计算 。 网 格 类 似 于 集群 ， 但 是 与 集群 相 比 ， 节 点 更 
加 分 散 ， 节 点 的 组 织 方式 也 更 加 灵活 ， 相 应 地 ， 平 均 每 个 节点 所 能 提供 的 计算 能 力 一 般 比 集群 
要 低 ， 并 且 节 点 间 的 通信 效率 也 较 低 。 


1.2.2 存储 系统 


存储 器 系统 是 一 个 由 不 同 的 容量 、 成 本 和 访问 时 
间 的 存储 器 构成 的 层次 结构 ， 这 些 存储 器 通过 适当 的 


硬件 和 软件 有 机 地 组 合 在 一 起 ， 如 图 1-6 所 示 。 
三 层 存储 器 分 别 是 高 速 缓存 (Cache) 、 主 存储 器 [ww | 硬件、 软件 


(Main Memory，MM) 和 辅助 存储 器 (外 存储 器 〉。 
也 可 以 将 存储 器 层次 分 为 4 层 ， 即 将 CPU 内 部 的 寄存 图 1-6 存储 器 层次 结构 示意 图 


高 速 缓存 [一 一 二 辅助 硬件 
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器 也 看 作 是 存储 器 的 一 个 层次 ， 高 速 缓存 也 常 分 为 多 级 。 
1， 存储 器 的 分 类 


1) 按 存储 器 所 处 位 置 分 类 

按 存储 器 所 处 的 位 置 ， 可 分 为 内 存 和 外 存 。 

(1) 内 存 。 也 称 为 主 存 ， 设 置 在 主机 内 (或 主机 板 上 〉， 用 来 存放 机 器 当前 运行 所 需要 的 
程序 和 数据 ， 以 便 向 CPU 提供 信息 。 相 对 于 外 存 ， 其 特点 是 容量 小 、 速 度 快 。 

(2) 外 存 。 也 称 为 辅 存 ， 如 磁盘 、 磁 带 和 光盘 等 ， 用 来 存放 当前 不 参与 运行 的 大 量 信息 ， 
必要 时 可 把 需要 的 信息 调 入 内 存 。 相 对 于 内 存 ， 外 存 的 容量 大 、 速 度 慢 。 

2) 按 存储 器 的 构成 材料 分 类 

按 构成 存储 器 的 材料 ， 可 分 为 磁 存 储 器 、 半 导体 存储 器 和 光 存 储 器 。 

(1) 磁 存 储 器 。 是 用 磁性 介质 做 成 的 ， 如 磁 芯 、 磁 泡 、 磁 膜 、 磁 鼓 、 磁 带 及 磁盘 等 。 

(2) 半导体 存储 器 。 根 据 所 用 元 件 又 可 分 为 双 极 型 和 MOS 型 ， 根 据 数据 是 否 需要 刷新 ， 
又 可 分 为 静态 (Static Memory) 和 动态 (Dynamic Memory) 两 类 。 

(3) 光 存 储 器 。 如 CD-ROM、DVD-ROM 等 光盘 〈Optical Disk) 存储 器 。 

3) 按 存储 器 的 工作 方式 分 类 

按 存储 器 的 工作 方式 可 分 为 读 写 存储 器 和 只 读 存 储 器 。 

(1) 读 写 存储 器 (Random Access Memory，RAM) 。 既 能 读 取 数据 也 能 存 入 数据 的 存储 
器 。 

(2) 只 读 存储 器 。 根 据 数据 的 写 入 方式 ， 这 种 存储 器 又 可 分 为 ROM、PROM、EPROM 和 
EEPROM 等 类 型 。 

Q@ 固定 只 读 存储 器 (Read Only Memory，ROM) 。 这 种 存储 器 的 内 容 是 在 厂家 生产 时 就 
写 好 的 ， 其 内 容 只 能 读 出 ， 不 能 改变 。 一 般 用 于 存放 系统 程序 BIOS 以 及 用 于 微 程序 控制 。 

@ 可 编程 的 只 读 存 储 器 (Programmable Read Only Memory，PROM) 。 其 中 的 内 容 可 以 
由 用 户 一 次 性 地 写 入 ， 写 入 后 不 能 再 修改 。 

@ 可 擦 除 可 编程 的 只 读 存 储 器 (Erasable Programmable Read Only Memory，EPROM) 。 
其 中 的 内 容 既 可 以 读 出 ， 也 可 以 由 用 户 写 入 ， 写 入 后 还 可 以 修改 。 改 写 的 方法 是 写 入 之 前 先 用 
紫外 线 照 射 15 一 20 分 钟 以 擦 去 所 有 信息 ， 然 后 再 用 特殊 的 电子 设备 写 入 信息 。 

@ 电 擦 除 可 编程 的 只 读 存 储 器 (Electrically Erasable Programmable Read Only Memory， 
EEPROM) 。 与 EPROM 相似 ，EEPROM 中 的 内 容 既 可 以 读 出 ， 也 可 以 进行 改写 。 只 不 过 这 种 
存储 器 是 用 电 擦 除 的 方法 进行 数据 的 改写 。 

@@ 闪 速 存储 器 (Flash Memory) 。 简 称 闪 存 ， 闪 存 的 特性 介 于 EPROM 和 EEPROM 之 间 ， 
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类 似 于 EEPROM， 也 可 使 用 电信 号 进行 信息 的 擦 除 操作 。 整 块 闪存 可 以 在 数秒 内 删除 ， 速 度 远 
快 于 EPROM。 

4) 按 访问 方式 分 类 

按 访问 方式 可 分 为 按 地 址 访问 的 存储 器 和 按 内 容 访问 的 存储 器 。 

5) 按 寻 址 方式 分 类 

按 寻 址 方式 可 分 为 随机 存储 器 、 顺 序 存储 器 和 直接 存储 器 。 

(1) 随机 存储 器 (Random Access Memory，RAM) 。 这 种 存储 器 可 对 任何 存储 单元 存 入 
或 读 取 数 据 ， 访 问 任何 一 个 存储 单元 所 需 的 时 间 是 相同 的 。 

(2) 顺序 存储 器 (Sequentially Addressed Memory，SAM) 。 访 问 数据 所 需要 的 时 间 与 数据 
所 在 的 存储 位 置 相关 ， 磁 带 是 典型 的 顺序 存储 器 。 

(3) 直接 存储 器 (Direct Addressed Memory，DAM) 。 介 于 随机 存 取 和 顺序 存 取 之 间 的 一 
种 寻 址 方式 。 磁 盘 是 一 种 直接 存 取 存储 器 ， 它 对 磁道 的 寻 址 是 随机 的 ， 而 在 一 个 磁道 内 则 是 顺 
序 寻 址 。 


2. 随机 访问 存储 器 


随机 访问 存储 器 (RAM) 分 为 两 类 : 静态 的 和 动态 的 。 静态 RAM (SRAM) 比 动态 RAM 
(DRAM) 更 快 ， 也 更 贵 。SRAM 常用 来 做 高 速 缓存 存储 器 ，DRAM 用 来 作为 主 存 及 图 形 系统 
的 帧 缓冲 存储 区 。 

(1) SRAM。 在 SRAM 中 ， 将 每 个 位 存储 在 一 个 双 稳 态 存储 器 单元 中 ， 每 个 单元 是 用 一 个 
六 晶体 管 电路 来 实现 的 。 只 要 供电 ，SRAM 存储 单元 的 内 容 就 保持 不 变 。 

(2) DRAM。 在 DRAM 中 ， 每 个 位 由 一 个 电容 和 一 个 晶体 管 组 成 ， 电 容量 很 小 (容量 越 
小 速度 越 快 ) 。 与 SRAM 不 同 ，DRAM 存储 器 单元 对 干扰 很 敏感 ， 电 容 的 电压 被 扰乱 之 后 也 
不 能 再 自行 恢复 ， 也 有 其 他 原因 会 导致 漏电 ， 因 此 ， 必 须 在 电容 中 的 电荷 漏 掉 之 前 进行 补充 ， 
以 保证 信息 不 会 丢失 ， 这 称 为 刷新 。DRAM 必须 周期 性 地 进行 刷新 操作 。 
由 于 集成 度 高 、 价 格 低 ，DRAM 常用 来 构成 主 存储 器 ， 主 要 采用 SDRAM (Synchronous 
Dynamic Random Access Memory)， 发 展 出 了 SDR SDRAM、DDR SDRAM、DDR2 SDRAM、 
DDR3 SDRAM、 DDR4 SDRAM 等 。 
DRAM 芯片 可 组 成 所 需 容量 要 求 的 内 存 模块 。 例 如 ， 由 4 个 8MX8 位 的 DRAM 芯片 
(DRAM 0、DRAM 1、DRAM 2、DRAM 3) 构成 8Mx32 位 的 内 存 区 域 ，32 位 字 的 4 个 字 节 分 
别 由 4 个 DRAM 芯片 的 同一 地 址 单元 提供 ，DRAM 0 提供 第 1 字 节 〈 最 低 字 节 ) ，DRAM 1 
提供 第 2 字 节 ，DRAM 2 提供 第 3 字 节 ，DRAM 3 提供 第 4 字 节 (最 高 字 节 ) ， 如 图 1-7 所 示 。 
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主 存 控制 器 


图 1-7 由 4 个 8MX8 位 的 


3. 高速 缓存 
高 速 缓存 《Cache) 是 用 来 存放 当前 最 活跃 的 程序 和 数据 ， 其 特点 是 : 容量 一 般 在 几 千 字 


节 到 几 兆 字 节 之 间 ， 速度 一 般 比 主 存 快 5 一 10 倍 ， 由 快速 半导体 存储 器 构成 ， 其 内 容 是 主 存 局 


部 域 的 副本 ， 


对 程序 员 来 说 是 透明 的 。 


1) 高 速 缓存 的 组 成 
Cache 一 般 位 于 CPU 与 主 存 之 间 , 主要 包括 管理 模块 、 由 相 联 存储 器 构成 的 存储 表 以 及 小 


容量 高 速度 存储 器 , 如 图 1-8 所 示 。 应 用 中 首先 判断 CPU 要 访问 的 信息 是 否 在 Cache 存储 器 中 ， 


若 在 即 为 命 
原则 决定 将 3 


P， 若 不 在 则 没有 命中 。 命 中 
E 存 的 一 块 信息 放 到 Cache 存 


一 3 人 r 字 


DRAM 芯片 组 成 8MX32 位 的 内 存 模块 


时 直接 对 Cache 存储 器 寻 址 ， 未 命中 时 ， 要 按照 替换 
储 器 的 某 一 块 里 。 
替换 管理 


了 


地 上 


址 | 


相 联 存储 表 


CPU 


图 1-8 ”Cache 的 组 成 


第 1 章 计算 机 系统 知识 “图 23 荐 


2) 高 速 缓存 中 的 地 址 映像 方法 
CPU 工作 时 给 出 的 是 主 存 的 地 址 , 要 从 Cache 存储 器 中 读 写 信息 , 就 需要 将 主 存 地 址 转换 
成 Cache 存储 器 的 地 址 ， 这 种 地 址 的 转换 叫 作 地 址 映像 。Cache 的 地 址 映像 有 以 下 三 种 方法 。 
(1) 直接 映像 。 直 接 映 像 是 指 主 存 的 块 与 Cache 块 的 对 应 关系 是 固定 的 ， 如 图 1-9 所 示 。 
在 这 种 映像 方式 下 ， 由 于 主 存 中 的 块 只 能 存放 在 Cache 存储 器 的 相同 块 号 中 ， 因 此 ， 只 要 
主 存 地 址 中 的 主 存 区 号 与 Cache 中 的 主 存 区 号 相同 ， 则 表明 访问 Cache 命中 。 一 旦 命中 ， 根 据 
主 存 地 址 中 的 区 内 块 号 立即 可 得 到 要 访问 的 Cache 存储 器 中 的 块 ， 而 块 内 地 址 就 是 主 存 地 址 中 
给 出 的 低位 地 址 。 
直接 映像 方式 的 优点 是 地 址 变换 很 简单 ， 缺 点 是 灵活 性 差 。 例 如 ， 不 同 区 号 中 块 号 相同 的 
块 无 法 同时 调 入 Cache 存储 器 ， 即 使 Cache 中 有 空闲 块 也 无 法 使 用 。 


Cache 第 0 块 
第 0 区 


| FE 第 M 区 
第 4 块 


主 存 地 址 | ” 主 存 区 号 区 内 块 号 ”| 。 块 内 地 址 


图 1-9 直接 映像 示意 图 


(2) 全 相 联 映像 。 全 相 联 映像 的 示意 图 如 图 1-10 所 示 。 同 样 ， 主 存 与 Cache 存储 器 均 分 成 
容量 相同 的 块 。 这 种 映像 方式 允许 主 存 的 任 一 块 可 以 调 入 Cache 存储 器 的 任何 一 个 块 的 空间 中 。 
进行 地 址 变换 时 ,利用 主 存 地 址 高 位 表示 的 主 存 块 号 与 Cache 中 保存 的 主 存 块 号 进行 比较 ， 
若 相 同 即 为 命中 。 这 时 根据 块 号 就 可 知道 要 访问 的 是 哪 一 块 。Cache 存储 器 的 块 找到 后 ， 块 内 
也 址 就 是 主 存 的 低位 地 址 。 这 时 便 可 以 读 写 Cache 块 中 的 内 容 。 在 变换 时 ， 当 找到 主 存 块 号 命 
中 时 ， 还 必须 知道 主 存 的 这 一 块 存 到 了 Cache 的 哪 一 块 里 面 。 
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主 存 地 址 主 存 志 号 | 块 内 地 址 | 


图 1-10 全 相 联 映像 示意 图 


全 相 联 映像 的 主要 优点 是 主 存 的 块 调 入 Cache 的 位 置 不 受 限制 ， 十 分 灵活 。 其 主要 缺点 是 
无 法 从 主 存 块 号 中 直接 获得 所 对 应 Cache 的 块 号 ， 变 换 比较 复杂 ， 速 度 比较 慢 。 

(3) 组 相 联 映 像 。 这 种 方式 是 前 面 两 种 方式 的 折衷 。 具 体 做 法 是 将 Cache 中 的 块 再 分 成 组 。 
例如 ， 假 定 Cache 有 16 块 ， 再 将 每 两 块 分 为 1 组 ， 则 Cache 的 块 就 分 为 8 组 。 主 存 同样 分 区 ， 
每 区 16 块 ， 再 将 每 两 块 分 为 1 组 ， 则 每 区 的 块 就 分 为 8 组 。 

组 相 联 映像 就 是 规定 组 采用 直接 映像 方式 而 块 采用 全 相 联 映像 方式 。 也 就 是 说 ， 主 存 任何 
区 的 0 组 只 能 存 到 Cache 的 0 组 中 ，1 组 只 能 存 到 Cache 的 1 组 中 ， 依 此 类 推 。 组 内 的 块 则 采 
用 全 相 联 映像 方式 ， 即 一 组 内 的 块 可 以 任意 存放 。 也 就 是 说 ， 主 存 一 组 中 的 任 一 块 可 以 存 入 
Cache 相应 组 的 任 一 块 中 。 

这 种 方式 下 ， 通 过 直接 映像 方式 来 决定 组 号 ， 在 一 组 内 再 用 全 相 联 映像 方式 来 决定 Cache 
中 的 块 号 。 由 主 存 地 址 高 位 决定 主 存 区 号 与 Cache 中 区 号 比较 可 决定 是 否 命 中 。 主 存 后 面 的 地 
址 即 为 组 号 。 

3) 替换 算法 

替换 算法 的 目标 就 是 使 Cache 获得 最 高 的 命中 率 。 常 用 算法 有 如 下 几 种 。 

(1) 随机 替换 算法 。 就 是 用 随机 数 发 生 器 产生 一 个 要 替换 的 块 号 ， 将 该 块 替 换 出 去 。 

(2) 先进 先 出 算法 。 就 是 将 最 先进 入 Cache 的 信息 块 替 换 出 去 。 

(3) 近期 最 少 使 用 算法 。 这 种 方法 是 将 近期 最 少 使 用 的 Cache 信息 块 替 换 出 去 。 


| 
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(4) 优化 替换 算法 。 这 种 方法 必须 先 执行 一 次 程序 ， 统 计 Cache 的 替换 情况 。 有 了 这 样 的 
先 验 信息 ， 在 第 二 次 执行 该 程序 时 便 可 以 用 最 有 效 的 方式 来 替换 。 

4) Cache 的 性 能 分 析 

Cache 的 性 能 是 计算 机 系统 性 能 的 重要 方面 。 命 中 率 是 Cache 的 一 个 重要 指标 。Cache 的 
设计 目标 是 在 成 本 允许 的 条 件 下 达到 较 高 的 命中 率 ， 使 存储 系统 具有 最 短 的 平均 访问 时 间 。 设 
及. 为 Cache 的 命中 率 ，t. 为 Cache 的 存 取 时 间 ， 如 为 主 存 的 访问 时 间 ， 则 Cache 存储 器 的 等 效 
加 权 平 均 访 问 时 间 妃 为 : 


ts, =H.t.+(-H.)t, =t.+(1—H.)(t, —t.) 

这 里 假设 Cache 访问 和 主 存 访 问 是 同时 启动 的 ， 其 中 ，t 为 Cache 命中 时 的 访问 时 间 ， 

(t 一 t) 为 失效 访问 时 间 。 如 果 在 Cache 不 命中 时 才 启 动 主 存 ， 则 
t=t+(1— HOO, 

在 指令 流水 线 中 ，Cache 访问 作为 流水 线 中 的 一 个 操作 阶段 ，Cache 失效 将 影响 指令 的 流 
水 。 因 此 ， 降 低 Cache 的 失效 率 是 提高 Cache 性 能 的 一 项 重要 措施 。 当 Cache 容量 比较 小 时 ， 
容量 因素 在 Cache 失效 中 占有 比较 大 的 比例 。 降 低 Cache 失效 率 的 方法 主要 有 选择 恰当 的 块 容 
、 提 高 Cache 的 容量 和 提高 Cache 的 相 联 度 等 。 
Cache 的 命中 率 与 Cache 容量 的 关系 是 : Cache 容量 越 大 ， 则 命中 率 越 高 ， 随 着 Cache 容 
量 的 增加 ， 其 失效 率 接近 0% (命中 率 逐 渐 接近 100% ) 。 但 是 ， 增 加 Cache 容量 意味 着 增加 
Cache 的 成 本 和 增加 Cache 的 命中 时 间 。 

5) 多 级 Cache 

在 多 级 Cache 的 计算 机 中 ，Cache 分 为 一 级 (LI Cache) 、 二 级 〈L2 Cache) 等 ，CPU 访 
存 时 首先 查找 LI1 Cache， 如 果 不 命中 ， 则 访问 L2 Cache， 直 到 所 有 级 别 的 Cache 都 不 命中 ， 
才 访 问 主 存 。 目 前 ，CPU 内 的 Cache 通常 为 二 级 结构 。 通 常 要 求 L1 Cache 的 速度 足够 快 ， 以 
赶 上 CPU 的 主 频 。L1 Cache 的 容量 一 般 都 比较 小 ， 为 几 千 字 节 到 几 十 千 字 节 ，L2 Cache 则 具 
有 较 高 的 容量 ， 一 般 为 几 百 字 节 到 几 兆 字 节 ， 以 具有 足够 高 的 命中 率 。 


4. 虚拟 存储 器 


在 概念 上 ， 可 以 将 主 存 存 储 器 看 作 一 个 由 若干 个 字 节 构成 的 存储 空间 ， 每 个 字 节 〈 称 为 一 
个 存储 单元 ) 有 一 个 地 址 编号 ， 主 存单 元 的 该 地 址 称 为 物理 地 址 (Physical Address) 。 当 需要 
访问 主 存 中 的 数据 时 , 由 CPU 给 出 要 访问 数据 所 在 的 存储 单元 地 址 , 然后 由 主 存 的 读 写 控制 部 
件 定位 对 应 的 存储 单元 ， 对 其 进行 读 〈 或 写 ) 操作 来 完成 访问 操作 。 

现代 系统 提供 了 一 种 对 主 存 的 抽象 , 称 为 虚拟 存储 (Virtual Memory), 使 用 虚拟 地 址 (Virtual 
Address， 由 CPU 生成 ) 的 概念 来 访问 主 存 ， 使 用 专门 的 MMU (Memory Management Unit) 将 
虚拟 地 址 转换 为 物理 地 址 后 访问 主 存 。 设 主 存 容量 为 4GB， 则 其 简化 后 的 访问 操作 和 内 存 模型 
如 图 1-11 所 示 。 
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i i eon 
号 物理 地 吉 
CpU MMU 1 0x00000001 
人 
~ oxo022ff8 | 
Ox0022ff59 
0x0022ffsa 
0x0022ffb ] 
0OxfffffffF 
数据 字 


图 1-11 内 存 模型 及 使 用 虚拟 地 址 访 存 示意 图 


虚拟 存储 器 实际 上 是 一 种 多 各 存储 器 ， 实 质 是 对 物理 存储 设备 进行 多 加 化 的 处 理 ， 并 将 统 
一 的 多 得 视图 呈现 给 用 户 。 因 此 ， 用 户 在 使 有 时， 操作 的 是 虚拟 设备 ， 无 须 关心 底层 的 物理 环 
境 ， 从 而 可 以 充分 利用 基于 异 构 平台 的 存储 空间 ， 达 到 最 优化 的 使 用 效率 。 

5， 相 联 存 储 器 

相 联 存储 器 是 一 种 按 内 容 访问 的 存储 器 。 其 工作 原理 就 是 把 数据 或 数据 的 某 一 部 分 作为 关 


键 字 , 将 该 关键 字 与 存储 器 中 的 每 一 单元 进行 比较 , 找 出 存储 器 中 所 有 与 关键 字 相 同 的 数据 字 。 
相 联 存储 器 各 部 件 的 功能 如 表 1-4 所 示 。 


表 1-4 部 件 功能 说 明 


部 件 功 能 

输入 检索 寄存 器 用 来 存放 要 检索 的 内 容 (关键 字 》 

屏蔽 寄存 器 用 来 屏蔽 那些 不 参与 检索 的 字段 
将 检索 的 关键 字 与 存储 体 的 每 一 单元 进行 比较 。 为 了 提高 速度 ， 比 较 器 的 

比较 器 数量 应 很 大 。 对 于 位 比较 器 ， 应 每 位 对 应 一 个 ， 应 有 2"XN 个 。 对 于 字 比 
较 器 应 有 2" 个 

存储 体 用 于 存放 信息 

匹配 寄存 器 用 来 记录 比较 的 结果 。 它 应 有 2” 个 二 进 制 位 , 用 来 记录 2” 个 比较 器 的 结果 ， 
1 为 相等 (匹配 ) ，0 为 不 相等 (不 匹配 》 

数据 寄存 器 用 来 存放 存储 体 中 某 个 单元 的 内 容 

也 址 寄存 器 、 地 址 译 码 器 | 使 相 联 存储 器 具有 按 地 址 查找 的 功能 
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相 联 存储 器 可 用 在 高 速 缓冲 存储 器 中 ; 在 虚拟 存储 器 中 用 来 作 段 表 、 页 表 或 快 表 存储 器 ; 
用 在 数据 库 和 知识 库 中 。 


6. 外 存储 器 


外 存储 器 用 来 存放 暂时 不 用 的 程序 和 数据 ， 并 且 以 文件 的 形式 存储 。 CPU 不 能 直接 访问 外 
存 中 的 程序 和 数据 , 只 有 将 其 以 文件 为 单位 调 入 主 存 后 才 可 访问 。 外 存储 器 由 磁 表 面 存储 器 (如 
磁盘 、 磁 带 ) 及 光盘 存储 器 构成 。 下 面 介绍 两 种 常用 的 外 存储 器 。 

(1) 磁盘 存储 器 

在 磁 表 面 存储 器 中 ,磁盘 的 存 取 速度 较 快 ， 且 具有 较 大 的 存储 容量 ， 是 目前 广泛 使 用 的 外 
存储 器 。 磁 盘存 储 器 由 盘 片 、 驱 动 器 、 控 制 嚣 和 接口 组 成 。 盘 片 用 来 存储 信息 。 驱 动 器 用 于 了 驱 
动 磁头 沿 盘面 径 向 运动 以 寻找 目标 磁道 位 置 ， 同 时 驱动 盘 片 以 额定 速率 稳定 旋转 ， 并 且 控 制 数 
据 的 写 入 和 读 出 。 控 制 器 接收 主机 发 来 的 命令 ， 将 它 转换 成 磁盘 驱动 器 的 控制 命令 ， 并 实现 主 
机 和 驱动 器 之 间 数 据 格式 的 转换 及 数据 传送 ， 以 控制 驱动 器 的 读 / 写 操作 。 一 个 控制 器 可 以 控制 
一 台 或 多 台 驱 动 器 。 接 口 是 主 机 和 磁盘 存储 器 之 间 的 连接 逻辑 。 

硬盘 是 最 常见 的 外 存储 器 。 一 个 硬盘 驱动 器 内 可 装 有 多 个 盘 片 ， 组 成 盘 片 组 ， 每 个 盘 片 都 
配 有 一 个 独立 的 磁头 。 所 有 记录 面 上 相同 序号 的 磁道 构成 一 个 圆柱 面 , 其 编号 与 磁道 编号 相同 。 
文件 存储 在 硬盘 上 时 尽 可 能 放 在 同一 圆柱 面 上 , 或 者 放 在 相 邻 柱 面 上 , 这 样 可 以 缩短 寻 道 时 间 。 

为 了 正确 存储 信息 ,将 盘 片 划 成 许多 同心 圆 ， 称 为 磁道 ， 从 外 到 里 编号 ， 最 外 一 圈 为 0 道 ， 
往 内 道 号 依次 增加 。 沿 径 向 的 单位 距离 的 磁道 数 称 为 道 密度 ， 单 位 为 tpi (每 英寸 磁道 数 ) 。 将 
一 个 磁道 沿 圆周 等 分 为 若干 段 ， 每 段 称 为 一 个 扇 段 或 扇 区 ， 每 个 扇 区 内 可 存放 一 个 固定 长 度 的 
数据 块 ， 如 512B。 磁 道上 单位 距离 可 记录 的 位 数 称 为 位 密度 ， 单 位 为 bpi〈 每 英寸 位 数 ) 。 因 
为 每 条 磁道 上 的 扇 区 数 相同 ， 而 每 个 扇 区 的 大 小 又 一 样 ， 所 以 每 条 磁道 都 记录 同样 多 的 信息 。 
又 因为 里 圈 磁 道 圆周 比 外 圈 磁 道 的 圆周 小 ， 所 以 里 圈 磁 道 的 位 密度 要 比 外 圈 磁 道 的 位 密度 高 。 
最 内 图 的 位 密度 称 为 最 大 位 密度 。 

硬盘 的 寻 址 信息 由 硬盘 驱动 号 、 圆 柱 面 号 、 磁 头号 〈 记 录 面 号 ) 、 数 据 块 号 〈 或 扇 区 号 ) 
以 及 交换 量 组 成 。 

磁盘 容量 有 两 种 指标 : 一 种 是 非 格式 化 容量 ， 它 是 指 一 个 磁盘 所 能 存储 的 总 位 数 ， 另 一 种 
是 格式 化 容量 ， 它 是 指 各 扇 区 中 数据 区 容量 总 和 。 计 算 公式 分 别 如 下 : 

非 格 式 化 容量 = 面 数 X〔 磁 道 数 / 面 )X 内 圆周 长 X 最 大 位 密度 
格式 化 容量 二 面 数 X 磁道 数 / 面 )X 〈 扇 区 数 / 道 ) X 〈 字 节 数 / 扇 区 》 

按 盘 片 是 否 固定 、 磁 头 是 否 移动 等 指标 ， 硬 盘 可 分 为 移动 磁头 固定 盘 片 的 磁盘 存储 器 、 固 

定 磁头 的 磁盘 存储 器 、 移 动 磁头 可 换 盘 片 的 磁盘 存储 器 和 温 彻 斯 特 磁 盘存 储 器 〈 简 称 温 盘 ) 。 
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(2) 光盘 存储 器 

光盘 存储 器 是 一 种 采用 聚焦 激光 束 在 盘 式 介质 上 非 接触 地 记录 高 密度 信息 的 存储 
装置 。 

根据 性 能 和 用 途 ,光盘 存储 器 可 分 为 只 读 型 光盘 (CD-ROM) 、 只 写 一 次 型 光盘 (WORM) 
和 可 擦 除 型 光盘 ， 只 读 型 光盘 是 由 生产 厂家 预先 用 激光 在 盘 片 上 蚀刻 不 能 再 改写 的 各 种 信息 ， 
目前 这 类 光盘 使 用 很 普遍 。 只 写 一 次 型 光盘 是 指 由 用 户 一 次 写 入 、 可 多 次 读 出 但 不 能 擦 除 的 光 
盘 ， 写 入 方法 是 利用 聚焦 激光 束 的 热能 ， 使 光盘 表面 发 生 永 久 性 变化 而 实现 的 。 可 擦 除 型 光盘 
是 读 写 性 光盘 ， 它 是 利用 激光 照射 引起 介质 的 可 逆 性 物理 变化 来 记录 信息 。 

光盘 存储 器 由 光学 、 电 学 和 机 械 部 件 等 组 成 。 其 特点 是 记录 密度 高 ;存储 容量 大 ， 采 用 非 
接触 式 读 / 写 信息 〈 光 头 距 离 光盘 通常 为 2mm) ; 信息 可 长 期 保存 (其 寿命 达 10 年 以 上 ) ; 采 
用 多 通道 记录 时 数据 传送 率 可 超过 200MB/s， 制 造成 本 低 ， 对 机 械 结构 的 精度 要 求 不 高 ， 存 取 
时 间 较 长 等 。 


7.， 磁盘 阵列 技术 


磁盘 阵列 是 由 多 台 磁 盘存 储 器 组 成 的 一 个 快速 、 大 容量 、 高 可 靠 性 的 外 存 子 系统 。 现 在 常 
见 的 称 为 廉价 元 余 磁盘 阵列 (Redundant Array of Independent Disk, RAID ) 。 目 前 , 常见 的 RAID 
如 表 1-5 所 示 。 


表 1-5 廉价 元 余 磁盘 阵列 

RAID 级 别 说 明 
RAID-0 是 一 种 不 具备 容错 能 力 的 磁盘 阵列 。 由 N 个 磁盘 存储 器 组 成 的 0 级 阵列 ， 其 平均 
RAID-0 故障 间隔 时 间 (MTBF) 是 单个 磁盘 存储 器 的 N 分 之 一 ， 但 数据 传输 率 是 单个 磁盘 存储 
器 的 NW 倍 
RAID-1 RAID-1 是 采用 镜像 容错 改善 可 靠 性 的 一 种 磁盘 阵列 
RAID-2 RAID-2 是 采用 海 明 码 作 错 误 检 测 的 一 种 磁盘 阵列 
RAID-3 减少 了 用 于 检验 的 磁盘 存储 器 的 台数 ， 从 而 提高 了 磁盘 阵列 的 有 效 容 量 。 一 般 只 
有 一 个 检验 盘 

RAID-4 RAID-4 是 一 种 可 独立 地 对 组 内 各 磁盘 进行 读 写 的 磁盘 阵列 ， 该 阵列 也 只 用 一 个 检验 盘 
RAID-5 是 对 RAID-4 的 一 种 改进 ， 它 不 设置 专门 的 检验 盘 。 同 一 台 磁 盘 上 既 记 录 数 据 ， 
也 记录 检验 信息 ， 这 就 解决 了 前 面 多 台 磁 盘 机 争 用 一 台 检验 盘 的 问题 
RAID-6 磁盘 阵列 采用 两 级 数据 元 余 和 新 的 数据 编码 以 解决 数据 恢复 问题 , 使 在 两 个 磁盘 
RAID-6 出 现 故障 时 仍然 能 够 正常 工作 。 在 进行 写 操作 时 , RAID-6 分 别 进行 两 个 独立 的 校 验 运算 ， 
形成 两 个 独立 的 元 余数 据 ， 写 入 两 个 不 同 的 磁盘 


RAID-3 


RAID-5S 


除 此 之 外 ， 上 述 各 种 类 型 的 RAID 还 可 以 组 合 起 来 ,构成 复合 型 的 RAID， 此 处 不 再 闭 述 。 


8.， 存储 域 网 络 
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在 大 型 服务 器 系统 的 背后 都 有 一 个 网 络 ， 把 一 个 或 多 个 服务 器 与 多 个 存储 设备 连接 起 来 ， 


每 个 存储 设备 可 以 是 RAID、 磁 带 备 份 系统 、 磁 
带 库 和 CD-ROM 库 等 ， 构 成 了 存储 域 网 络 
(Storage Area Network，SAN) 。 这 样 的 网 络 不 
仅 解决 了 服务 器 对 存储 容量 的 要 求 , 还 可 以 使 多 
个 服务 器 之 间 可 以 共享 文件 系统 和 辅助 存储 空 
间 ， 避 免 数 据 和 程序 代码 的 重复 存储 ， 提 高 辅助 
存储 器 的 利用 率 。 另 外 ，SAN 还 实现 了 分 布 式 
存储 系统 的 集中 管理 , 降低 了 大 容量 存储 系统 的 
管理 成 本 , 提高 了 管理 效率 。 存 储 域 网 络 是 连接 
服务 器 与 存储 设备 的 网 络 , 它 能 够 将 多 个 分 布 在 
不 同 地 点 的 RAID 组 织 成 一 个 逻辑 存储 设备 , 供 
多 个 服务 器 共享 访问 ， 如 图 1-12 所 示 。 


1.2.3 ”输入 输出 技术 


存储 池 


河 ww 


图 1-12 SAN 的 结 


1. 微型 计算 机 中 最 常用 的 内 存 与 接口 的 编 址 方式 
计算 机 系统 中 存在 多 种 内 存 与 接口 地 址 的 编 址 方法 ， 常 见 的 是 下 面 两 种 : 内 存 与 接口 地 址 


独立 编 址 和 内 存 与 接口 地 址 统一 编 址 。 
(1) 内 存 与 接口 地 址 独立 编 址 方法 


内 存 与 接口 地 址 独立 编 址 方式 下 ， 内 存 地 址 和 接口 地 址 是 完全 独立 的 两 个 地 址 空间 ， 它 们 
是 完全 独立 的 并 且 是 相互 隔离 的 。 访 问 数 据 时 所 使 用 的 指令 也 完全 不 同 ， 用 于 接口 的 指令 只 用 


(2) 内 存 与 接口 地 址 统一 编 址 方法 


二 
.办 


区 间 内 存单 元 也 绝 不 能 再 


于 接口 读 写 ， 其 余 的 指令 全 都 是 用 于 内 存 的 。 因 此 ， 在 编程 序 或 读 程序 时 很 易 使 用 和 辨认 。 
这 种 编 址 方式 的 缺点 就 是 用 于 接口 的 指令 太 少 、 功 能 太 弱 。 


在 这 种 编 址 方法 里 ， 内 存 地 址 和 接口 地 址 统一 在 一 个 公共 的 地 址 空间 里 ， 即 内 存单 元 和 接 
口 共用 地 址 空间 。 在 这 些 地 址 空间 里 划分 出 一 部 分 地 址 分 配给 接口 使 用 ， 其 余地 址 归 内 存单 元 
使 用 。 分 配给 内 存 的 地 址 区 间 只 能 用 于 内 存单 元 ， 


接口 绝 不 允许 使 用 。 同 样 ， 分 配给 接口 的 地 


这 种 编 直方 法 的 优点 是 原则 上 用 于 内 存 的 指令 全 都 可 以 用 于 接口 , 这 就 大 大 地 增强 了 对 接 


的 操作 功能 ， 而 且 在 指令 上 也 不 再 区 分 内 存 或 接口 指令 。 
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该 编 址 方法 的 缺点 就 在 于 整个 地 址 空间 被 分 成 两 部 分 ， 其 中 一 部 分 分 配给 接口 使 用 ,剩余 
的 为 内 存 所 用 , 这 经 常会 导致 内 存 地 址 不 连续 。 当 用 于 内 存 的 指令 和 用 于 接口 的 指令 完全 相同 ， 
维护 程序 时 就 需 根据 参数 定义 表 仔 细 加 以 辨认 。 


2. 程序 控制 方式 


在 完成 外 设 数 据 的 输入 输出 时 ， 整 个 输入 输出 过 程 是 在 CPU 执行 程序 的 控制 下 完成 的 。 这 种 
方式 分 为 无 条 件 传 送 和 程序 查询 方式 两 种 。 

1) 无 条 件 传 送 

在 此 情况 下 ， 外 设 总 是 准备 好 的 ， 它 可 以 无 条 件 地 随时 接收 CPU 发 来 的 输出 数据 ， 也 能 够 
无 条 件 地 随时 向 CPU 提供 需要 输入 的 数据 。 

2) 程序 查询 方式 

在 这 种 方式 下 ， 利 用 查询 方式 进行 输入 输出 ， 就 是 通过 CPU 执行 程序 查询 外 设 的 状态 ， 
判断 外 设 是 否 准备 好 接收 数据 或 准备 好 了 向 CPU 输入 的 数据 。 根 据 这 种 状态 ，CPU 有 针对 性 
地 为 外 设 的 输入 输出 服务 。 

通常 ， 一 个 计算 机 系统 中 可 以 存在 着 多 种 不 同 的 外 设 ， 如 果 这 些 外 设 是 用 查询 方式 工作 ， 
则 CPU 应 对 这 些 外 设 逐 一 进行 查询 ,发现 哪个 外 设 准备 就 绪 就 对 该 外 设 服务 。 这 种 工作 方式 有 
两 大 缺点 : 

(1) 降低 了 CPU 的 效率 。 在 这 种 工作 方式 下 ，CPU 不 做 别 的 事 ， 只 是 不 停 地 对 外 设 的 状态 进 
行 查 询 。 在 实际 的 工程 应 用 中 ， 对 那些 慢 速 的 外 设 在 不 影响 到 外 设 工 作 时 ，CPU 可 以 执行 其 他 
任务 。 

(2) 对 外 部 的 突 发 事件 无 法 做 出 实时 响应 。 

程序 控制 IO 的 主要 缺点 在 于 CPU 必须 等 待 /O 系统 完成 数据 传输 任务 ， 在 此 期 间 CPU 需 
定期 地 查询 IO 系统 的 状态 ， 以 确认 传输 是 否 完成 。 因 此 ， 整 个 系统 的 性 能 严重 下 降 。 


3， 中断 方式 


利用 中 断 方式 完成 数据 的 输入 /输出 过 程 为 : 当 IO 系统 与 外 设 交 换 数据 时 , CPU 无 须 等 待 
也 不 必 去 查询 IO 的 状态 ， 而 可 以 处 理 其 他 任务 。 当 IO 系统 准备 好 以 后 ， 则 发 出 中 断 请 求 信 
号 通知 CPU，CPU 接 到 中 断 请 求 信号 后 ,保存 正在 执行 程序 的 现场 ， 转 入 IO 中 断 服务 程序 的 
执行 ， 完成 与 IO 系统 的 数据 交换 ， 然 后 再 返回 被 打 断 的 程序 继续 执行 。 与 程序 控制 方式 相 比 ， 
中 断 方式 因为 CPU 无 须 等 待 而 提高 了 效率 。 

1) 中 断 处 理 方法 

在 系统 中 具有 多 个 中 断 源 的 情况 下 ,常用 的 处 理 方法 有 多 中 断 信 号 线 法 (Multiple Interrupt 
Lines) 、 中 断 软件 查询 法 〈Software Poll) 、 菊 花 链 法 〈Daisy Chain) 、 总 线 仲 裁 法 和 中 断 向 


量 表 法 。 
(1) 多 
请 求 。 


中 断 信号 线 法 。 每 个 中 断 源 都 有 属于 自己 的 一 根 中 断 请 求 信号 线 向 CPU 提出 
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(2) 中 断 软件 查询 法 。 当 CPU 检测 到 一 个 中 断 请 求 信号 以 后 ， 即 转 入 到 中 断 服务 程序 去 
轮 询 每 个 中 断 源 以 确定 是 谁 发 出 了 中 断 请 求 信号 。 对 各 个 设备 的 响应 优先 级 由 软件 设 定 。 

(3) 菊花 链 法 。 软 件 查询 的 缺陷 在 于 花费 时 间 太 多 。 菊 花 链 法 实际 上 是 一 种 硬件 查询 法 。 
所 有 的 IO 模块 共享 一 根 共 同 的 中 断 请 求 线 , 而 中 断 确认 信号 则 以 链 式 在 各 模块 间 相 连 。 当 CPU 
检测 到 中 断 请 求 信号 ， 则 发 出 中 断 确 认 信号 。 中 断 确认 信号 依次 在 IO 模块 间 传 递 ， 直 到 发 出 
请 求 的 模块 为 止 ， 该 模块 将 其 ID 送 往 数据 线 由 CPU 读 取 。 

(4) 总 线 仲 裁 法 。 一 个 IO 设备 在 发 出 中 断 请 求 之 前 ， 必 须 先 获得 总 线 控制 权 ， 所 以 可 由 
总 线 仲裁 机 制 来 裁定 谁 可 以 发 出 中 断 请 求 信号 。 当 CPU 发 出 中 断 响应 信号 后 , 该 设备 即 把 自己 
的 ID 发 往 数据 线 。 

(5) 中 断 向 量 表 法 。 中 断 向 量 表 用 来 保存 各 个 中 断 源 的 中 断 服务 程 序 的 入 口 地 址 。 当 外 设 
发 出 中 断 请 求 信号 〈INTR) 以 后 ， 由 中 断 控制 器 (INTC) 确定 其 中 断 号 ， 并 根据 中 断 号 查找 


1-13 所 示 。 中 断 源 的 优先 级 由 INTC 来 控制 。 


中 断 向 量 表 来 取得 其 中 断 服务 程序 的 入 口 地 址 ， 同 时 INTC 把 中 断 请 求 信号 提交 给 CPU， 如 图 


2) 中 断 优先 级 控制 
在 具有 多 个 中 断 源 的 计算 机 系统 中 ， 各 中 断 源 对 服务 的 要 求 紧 迫 程度 可 能 不 同 。 在 这 样 的 


计算 机 系统 中 ， 就 需要 按 
在 中 断 优先 级 控制 系统 


(中 断 向 量 表 ) 
中 断 号 
外 设 1 上 =| INTC 二 | 地 址 1 
厂 一 J 中 断 服务 
外 设 n ”| 广 一 NTR 地 址 n 
图 1-13 中 断 向 量 表 法 


h 断 源 的 轻重 缓急 来 安排 对 它们 的 服务 。 
h, 给 最 紧迫 的 中 断 源 分 配 高 的 优先 级 ， 而 给 那些 要 求 相 对 不 紧迫 


的 中 断 源 分 配 低 一 些 的 优先 级 。 在 进行 优先 级 控制 时 解决 以 下 两 种 情况 。 


(1) 当 不 同 优先 级 的 多 个 中 断 源 


断 源 。 


同时 提出 中 断 请 求 时 ，CPU 应 优先 响应 优先 级 最 高 的 中 


(2) 当 CPU 正在 对 某 一 个 中 断 源 服务 时 ， 又 有 比 它 优 先 级 更 高 的 中 断 源 提出 中 断 请 求 ， 


CPU 应 能 


可 到 原先 被 


P 断 的 优先 级 较 低 的 中 断 朋 


时 中 断 正 在 执行 的 中 断 服务 程序 而 转 去 对 优先 级 更 高 的 中 断 源 服务 ,服务 结束 后 再 
妥 务 程序 继续 执行 。 这 种 情况 称 为 中 断 嵌 套 ， 即 一 个 中 断 
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服务 程序 的 执行 中 医 套 着 另 一 个 中 断 服务 程序 的 执行 过 程 。 
4. DMA 方式 


在 计算 机 与 外 设 交换 数据 的 过 程 中 ,无论 是 无 条 件 传送 、 利 用 查询 方式 传送 还 是 利用 中 断 
方式 传送 ， 都 需要 由 CPU 通过 执行 程序 来 实现 。 这 就 限制 了 数据 的 传送 速度 。 

直接 内 存 存 取 (Direct Memory Access，DMA) 是 指数 据 在 内 存 与 IO 设备 间 的 直接 成 块 
传送 , 即 在 内 存 与 IO 设备 间 传 送 一 个 数据 块 的 过 程 中 , 不 需要 CPU 的 任何 干涉 ,只 需要 CPU 
在 过 程 开 始 启动 〈 即 向 设备 发 出 “传送 一 块 数据 ”的 命令 ) 与 过 程 结束 (CPU 通过 轮 询 或 中 断 
得 知 过 程 是 否 结束 和 下 次 操作 是 否 准备 就 绪 ) 时 的 处 理 , 实际 操作 由 DMA 硬件 直接 执行 完成 ， 
CPU 在 此 传送 过 程 中 可 处 理 别 的 任务 。 

DMA 传送 的 一 般 过 程 如 图 1-14 所 示 。 


内 存 
CPU 系统 | 下 
4 系统 总 线 > 
~|IHOLD 形成 1 | | 
HLDA 和 PMA 
1/O 接 口 空 制 器 
响应 | 4 
请 求 | 
外 设 | | 


图 1-14 DMA 过 程 示意 图 


(1) 外 设 向 DMA 控制 器 (DMAC) 提出 DMA 传送 的 请 求 。 

(2) DMA 控制 器 向 CPU 提出 请 求 ， 其 请 求 信 号 通常 加 到 CPU 的 保持 请 求 输入 端 HOLD 上 。 

(3) CPU 在 完成 当前 的 总 线 周期 后 立即 对 此 请 求 进行 响应 ，CPU 的 响应 包括 两 个 方面 的 
内 容 : 一 方面 ，CPU 将 有 效 的 保持 响应 信号 HLDA 输出 加 到 DMAC 上 ， 告 诉 DMAC 它 的 请 
求 已 得 到 响应 ， 另 一 方面 CPU 将 其 输出 的 总 线 信号 置 为 高 阻 ， 这 就 意味 着 CPU 放弃 了 对 总 线 
的 控制 权 。 

(4) 此 时 DMAC 获得 了 对 系统 总 线 的 控制 权 ， 开 始 实施 对 系统 总 线 的 控制 。 同 时 向 提出 
请 求 的 外 设 送出 DMAC 的 响应 信号 ， 告 诉 外 设 其 请 求 已 得 到 响应 ， 现 在 准备 开始 进行 数据 的 
传送 。 

(5) DMAC 送出 地 址 信号 和 控制 信号 ， 实 现 数据 的 高 速 传送 。 
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(6) 当 DMAC 将 规定 的 字 节 数 传 送 完 时 ， 它 就 将 HOLD 信号 变 为 无 效 并 加 到 CPU 上 。 撤 

销 对 CPU 的 请 求 。CPU 检测 到 无 效 的 HOLD 就 知道 DMAC 已 传送 结束 ，CPU 就 送出 无 效 的 
HLDA 响应 信号 ， 同 时 重新 获得 系统 总 线 的 控制 权 ， 接 着 DMA 前 的 总 线 周期 继续 执行 下 面 的 
总 线 周 期 。 
在 DMA 传送 过 程 中 无 须 CPU 的 干预 ， 整 个 系统 总 线 完全 交 给 了 DMAC， 由 它 控制 系统 
总 线 完成 数据 传送 。 在 DMA 传送 数据 时 要 占用 系统 总 线 ， 根 据 占用 总 线 的 方法 不 同 ，DMA 可 
以 分 为 中 央 处 理 器 停止 法 、 总 线 周 期 分 时 法 和 总 线 周 期 挪用 法 等 。 无 论 采 用 哪 种 方法 , 在 DMA 
传送 数据 期 间 ，CPU 不 能 使 用 总 线 。 


S， 通道 方式 和 外 围 处 理 机 方式 


DMA 方式 的 出 现 减 轻 了 CPU 对 IO 操作 的 控制 , 使 得 CPU 的 效率 显著 提高 , 而 通道 的 出 
现 则 进一步 提高 了 CPU 的 效率 。 

通道 是 一 个 具有 特殊 功能 的 处 理 器 , 又 称 为 输入 输出 处 理 器 (Input/Output Processor, IOP)， 
它 分 担 了 CPU 的 一 部 分 功能 , 可 以 实现 对 外 围 设备 的 统一 管理 , 完成 外 围 设备 与 主 存 之 间 的 数 
据 传送 。 

通道 方式 大 大 提高 了 CPU 的 工作 效率 ， 然 而 这 种 效率 的 提高 是 以 增加 更 多 的 硬件 为 代 
价 的 。 

外 围 处 理 机 (Peripheral Processor Unit，PPU ) 方式 是 通道 方式 的 进一步 发 展 。PPU 是 专 
处 理 机 , 它 根据 主机 的 IO 命令 , 完成 对 外 设 数据 的 输入 输出 。 在 一 些 系统 中 , 设置 了 多 台 PPU， 
分 别 承担 IO 控制 、 通 信 、 维 护 诊断 等 任务 。 从 某 种 意义 上 说 ， 这 种 系统 已 变 成 分 布 式 的 多 机 


1.2.4 总 线 结构 


所 谓 总 线 (Bus) ， 是 指 计算 机 设备 和 设备 之 间 传 输 信息 的 公共 数据 通道 。 总 线 是 连接 计 
算 机 硬件 系统 内 多 种 设备 的 通信 线路 ， 它 的 一 个 重要 特征 是 由 总 线 上 的 所 有 设备 共享 ， 因 此 可 
以 将 计算 机 系统 内 的 多 种 设备 连接 到 总 线 上 。 


1. 总 线 的 分 类 


微机 中 的 总 线 分 为 数据 总 线 、 地 址 总 线 和 控制 总 线 3 类 。 不 同型 号 的 CPU 芯片 ， 其 数据 
总 线 、 地 址 总 线 和 控制 总 线 的 条 数 可 能 不 同 。 

数据 总 线 (Data Bus，DB) 用 来 传送 数据 信息 ， 是 双向 的 。CPU 既 可 通过 DB 从 内 存 或 
输入 设备 读 入 数据 ， 也 可 通过 DB 将 内 部 数据 送 至 内 存 或 输出 设备 。DB 的 宽度 决定 了 CPU 
和 计算 机 其 他 设备 之 间 每 次 交换 数据 的 位 数 。 
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地 址 总 线 (Address Bus，AB) 用 于 传送 CPU 发 出 的 地 址 信息 ， 是 单 向 的 。 传 送 地 址 信 
息 的 目的 是 指明 与 CPU 交换 信息 的 内 存单 元 或 IO 设备 。 存储器 是 按 地 址 访问 的 ， 所 以 每 个 
存储 单元 都 有 一 个 固定 地 址 ， 要 访问 1MB 存储 器 中 的 任 一 单元 ， 需 要 给 出 ?2 个 地 址 ， 即 需 
要 20 位 地 址 (22=-1M) 。 因 此 ， 地 址 总 线 的 宽度 决定 了 CPU 的 最 大 寻 址 能 力 。 

控制 总 线 (Control Bus，CB) 用 来 传送 控制 信号 、 时 序 信号 和 状态 信息 等 。 其 中 有 的 信 
号 是 CPU 向 内 存 或 外 部 设备 发 出 的 信息 ， 有 的 是 内 存 或 外 部 设备 向 CPU 发 出 的 信息 。 显 然 ， 
CB 中 的 每 一 条 线 的 信息 传送 方向 都 是 单方 向 且 确定 的 , 但 CB 作为 一 个 整体 则 是 双向 的 。 所 
以 ， 在 各 种 结构 框图 中 ， 凡 涉及 控制 总 线 CB， 均 是 以 双向 线 表示 。 

总 线 的 性 能 直接 影响 到 整 机 系统 的 性 能 ， 而 且 任 何 系统 的 研制 和 外 围 模块 的 开发 都 必须 
依从 所 采用 的 总 线 规范 。 总 线 技术 随 着 微机 结构 的 改进 而 不 断 发 展 与 完善 。 


2， 常见 总 线 


(1) ISA 总 线 JJSA 是 工业 标准 总 线 , 只 能 支持 16 位 的 IO 设备 ,数据 传输 率 大 约 是 16MB/S， 
也 称 为 AT 标准 。 

(2) EISA 总 线 。EISA 是 在 ISA 总 线 的 基础 上 发 展 起 来 的 32 位 总 线 。 该 总 线 定义 32 位 地 
址 线 ,32 位 数据 线 以 及 其 他 控制 信号 线 、 电 源 线 、 地 线 等 共 196 个 接点 .总 线 传输 速率 达 33MB/s。 

(3) PCI 总 线 。PCI 总 线 是 目前 微型 机 上 广泛 采用 的 内 总 线 ， 采 用 并 行 传输 方式 。PCI 总 
线 有 适 于 32 位 机 的 124 个 信号 的 标准 和 适 于 64 位 机 的 188 个 信号 的 标准 。PCI 总 线 的 传输 速 
率 至 少 为 133MB/s，64 位 PCI 总 线 的 传输 速率 为 266MB/s。PCI 总 线 的 工作 与 CPU 的 工作 是 
相互 独立 的 ， 也 就 是 说 ，PCI 总 线 时 钟 与 处 理 器 时 钟 是 独立 的 、 非 同步 的 。PCI 总 线 上 的 设备 
是 即 插 即 用 的 。 接 在 PCI 总 线 上 的 设备 均 可 以 提出 总 线 请 求 ， 通 过 PCI 管理 器 中 的 仲裁 机 构 允 
许 该 设备 成 为 主 控 设备 ， 主 控 设 备 与 从 属 设 备 间 可 以 进行 点 对 点 的 数据 传输 。PCI 总 线 能 够 对 
所 传输 的 地 址 和 数据 信号 进行 奇偶 校 验 检测 。 

(4) PCI Express 总 线 。PCI Express 简称 为 PCI-E， 采用 点 对 点 串 行 连接 ， 每 个 设备 都 有 自 
己 的 专用 连接 ， 不 需要 向 整个 总 线 请 求 带 宽 ， 而 且 可 以 把 数据 传输 率 提高 到 一 个 很 高 的 频率 。 
相对 于 传统 PCI 总 线 在 单一 时 间 周 期 内 只 能 实现 单 向 传输 , PCI Express 的 双 单 工 连接 能 提供 更 
高 的 传输 速率 和 质量 。 
PCI Express 的 接口 根据 总 线 位 宽 不 同 而 有 所 差异 ， 包 括 X1、X4、X8 以 及 X16 (X2 模式 
将 用 于 内 部 接口 而 非 插 槽 模式 ) ， 其 中 X1 的 传输 速度 为 250MB/s， 而 X16 就 是 等 于 16 倍 于 
XI1 的 速度 ， 即 是 4GB/s。 较 短 的 PCI Express 卡 可 以 插入 较 长 的 PCI Express 插 槽 中 使 用 。PCI 
Express 接口 能 够 支持 热 拔 插 。 同 时 ，PCI Express 总 线 支持 双向 传输 模式 ， 还 可 以 运行 全 双 工 
模式 , 它 的 双 单 工 连接 能 提供 更 高 的 传输 速率 和 质量 , 它们 之 间 的 差异 与 半 双 工 和 全 双 工 类 似 。 
因此 连接 的 每 个 装置 都 可 以 使 用 最 大 带宽 。 
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(5) 前 端 总 线 。 

微机 系统 中 ， 前 端 总 线 (Front Side Bus，FSB) 是 将 CPU 连接 到 北桥 芯片 的 总 线 。 选 购 3 
板 和 CPU 时 ， 要 注意 两 者 的 搭配 问题 ， 一 般 来 说 ， 如 果 CPU 不 超频 ， 那 么 前 端 总 线 是 由 CPU 
决定 的 ， 如 果 主 板 不 支持 CPU 所 需要 的 前 端 总 线 ， 系 统 就 无 法 工作 。 也 就 是 说 ， 需 要 主板 和 
CPU 都 支持 某 个 前 端 总 线 ， 系 统 才 能 工作 。 通 常情 况 下 ， 一 个 CPU 默认 的 前 端 总 线 是 唯一 的 。 
北桥 芯片 负责 联系 内 存 、 显 卡 等 数据 吞吐 量 最 大 的 部 件 ， 并 与 南 桥 芯片 连接 。CPU 通过 前 端 总 
线 (FSB) 连接 到 北桥 芯片 ， 进 而 通过 北桥 芯片 与 内 存 、 显 卡 交换 数据 。FSB 是 CPU 和 外 界 交 
换 数据 的 最 主要 通道 ， 因此 FSB 的 数据 传输 能 力 对 计算 机 整体 性 能 作用 很 大 ， 如 果 没 足够 快 的 
FSB， 再 强 的 CPU 也 不 能 明显 提高 计算 机 整体 速度 。 

(6) RS-232C。RS-232C 是 一 条 串 行 外 总 线 ， 其 主要 特点 是 所 需 传输 线 比 较 少 ， 最 少 只 需 
三 条 线 (一 条 发 、 一 条 收 、 一 条 地 线 ) 即 可 实现 全 双 工 通信 。 传 送 距离 远 ， 用 电 平 传送 为 13m， 
电流 环 传送 可 达 千 米 。 有 多 种 可 供 选 择 的 传送 速率 。 采 用 非 归 零 码 负 逻 辑 工作 ， 电 平 入 -3V 为 
逻辑 1， 而 电 平 宇 +3V 为 逻辑 0， 具 有 较 好 的 抗 干扰 性 。 

(7) SCSI 总 线 。 小 型 计算 机 系统 接口 (SCSI) 是 一 条 并 行 外 总 线 ， 广 泛 用 于 连接 软 硬 磁 
盘 、 光 盘 、 扫 描 仪 等 。 该 接口 总 线 早 期 是 8 位 的 , 后 来 发 展 到 16 位 。 传 输 速率 由 SCSI-1 的 5MB/s 
到 16 位 的 Ultra2 SCSI 的 80MB/s。 今 天 的 传输 速率 已 高 达 320MB/s。 该 总 线 上 最 多 可 接 63 种 
外 设 ， 传 输 距离 可 达 20m〈 差 分 传送 )。 

(8) USB。 通 用 串 行 总 线 (USB) 当前 风头 正 劲 ， 近 几 年 得 到 十 分 广泛 的 应 用 。USB 由 4 
条 信号 线 组 成 ， 其 中 两 条 用 于 传送 数据 ， 另 外 两 条 传送 十 5V 容量 为 500mA 的 电源 。 可 以 经 过 
集线器 (Hub) 进行 树 状 连接 ， 最 多 可 达 5 层 。 该 总 线 上 可 接 127 个 设备 。USB 1.0 有 两 种 传送 
速率 低速 为 1.5Mb/s， 高 速 为 12Mb/s。USB 2.0 的 传送 速率 为 480Mb/s。USB 总 线 最 大 的 优 
点 还 在 于 它 支 持 即 插 即 用 ， 并 支持 热 插 拔 。 

(9) IEEE-1394。IEEE-1394 是 高 速 串 行 外 总 线 ， 近 几 年 得 到 广泛 应 用 。IEEE-1394 也 支持 
外 设 热 插 拔 ， 可 为 外 设 提 供电 源 ， 省 去 了 外 设 自 带 的 电源 ， 能 连接 多 个 不 同 设备 ， 支 持 同步 和 
异步 数据 传输 。IEEE-1394 由 6 条 信号 线 组 成 ， 其 中 两 条 用 于 传送 数据 ， 两 条 传送 控制 信号 ， 
另外 两 条 传送 8 一 40V 容量 为 1300mA 的 电源 ,IEEE-1394 总 线 理 论 上 可 接 63 个 设备 .IEEE-1394 
的 传送 速率 从 400Mb/s、800Mb/s、1600Mb/s 直到 3.2Gb/s。 

(10) IEEE-488 总 线 。IEEE-488 是 并 行 总 线 接口 标准 。 微 计算 机 、 数 字 电 压 表 、 数 码 显 
示 器 等 设备 及 其 他 仪器 仪表 均 可 用 IEEE-488 总 线 连 接 装配 ， 它 按照 位 并 行 、 字 节 串 行 双向 异 
步 方 式 传输 信号 ， 连 接 方 式 为 总 线 方式 ， 仪 器 设备 不 需 中 介 单 元 直接 并 联 于 总 线 上 。 总 线 上 
最 多 可 连接 15 台 设 备 。 最 大 传输 距离 为 20m， 信 号 传输 速度 一 般 为 500kB/s， 最 大 传输 速度 
为 1MB/s。 


[a 
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1.3 安全 性 、 可 靠 性 与 系统 性 能 评测 基础 知识 


1.3.1 计算 机 安全 概述 


计算 机 安全 是 一 个 涵盖 非常 广 的 课题 ， 既 包括 硬件 、 软 件 和 技术 ， 又 包括 安全 规划 、 安 全 
管理 和 安全 监督 。 计 算 机 安全 可 包括 安全 管理 、 通 信 与 网 络 安全 、 密 码 学 、 安 全 体系 及 模型 、 
容错 与 容 灾 、 涉 及 安全 的 应 用 程序 及 系统 开发 、 法 律 、 犯 罪 及 道德 规范 等 领域 。 

其 中 安全 管理 是 非常 重要 的 ， 作 为 信息 系统 的 管理 部 门 应 根据 管理 原则 和 该 系统 处 理 数 据 
的 保密 性 ， 制 定 相应 的 管理 制度 或 规范 。 例 如 ， 根 据 工 作 的 重要 程度 确定 系统 的 安全 等 级 ， 根 
据 确定 的 安全 等 级 确定 安全 管理 的 范围 ， 制 定 相应 的 机 房管 理 制度 、 操 作 规程 、 系 统 维护 措施 
以 及 应 急 措施 等 。 


1. 计算 机 的 安全 等 级 


计算 机 系统 中 的 三 类 安全 性 是 指 技术 安全 性 、 管 理 安全 性 和 政策 法 律 安全 性 。 但 是 ， 一 
安全 产品 的 购买 者 如 何 知道 产品 的 设计 是 否 符合 规范 ， 是 否 能 解决 计算 机 网 络 的 安全 问题 ， 不 
同 的 组 织 机 构 各 自 都 制定 了 一 套 安全 评估 准则 。 一 些 重要 的 安全 评估 准则 如 下 。 

(1) 美国 国防 部 和 国家 标准 局 推出 的 《可 信 计 算 机 系统 评估 准则 》 (TCSEC》。 

(2) 加 拿 大 的 《可 信 计 算 机 产品 评估 准则 》 (CTCPEC) 。 

(3) 美国 制定 的 《联邦 〈 最 低 安 全 要 求 ) 评估 准则 》 (FC) 。 

(4) 欧洲 英 、 法 、 德 、 荷 四 国 国防 部 门 信息 安全 机 构 联合 制定 的 《信息 技术 安全 评估 准则 》 
(ITSEC) ， 该 准则 事实 上 已 成 为 欧盟 各 国 使 用 的 共同 评估 标准 。 

(5) 美国 制定 的 《信息 技术 安全 通用 评估 准则 》 【简称 CC 标准 ) ， 国 际 标准 组 织 〈ISO) 
于 1996 年 批准 CC 标准 以 ISO/IEC 15408 一 1999 名 称 正式 列 入 国际 标准 系列 。 

其 中 , 美国 国防 部 和 国家 标准 局 的 《可 信 计 算 机 系统 评测 标准 》TCSEC/TDI 将 系统 划分 为 
4 组 7 个 等 级 ， 如 表 1-6 所 示 。 


表 1-6 安全 性 的 级 别 


可 验证 安全 设计 。 提 供 B3 级 保护 ， 同 时 给 出 系统 的 形式 化 隐秘 通道 分 析 ， 非 形 
式 化 代码 一 致 性 验证 

| B3 | 安全 域 。 该 级 的 TCB 必须 满足 访问 监控 器 的 要 求 ， 提 供 系 统 恢复 过 程 
结构 化 安全 保护 。 建立 形式 化 的 安全 策略 模型 ， 并 对 系统 内 的 所 有 主体 和 客体 实 


Bl 标记 安全 保护 。 对 系统 的 数据 加 以 标记 ， 并 对 标记 的 主体 和 客体 实施 强制 存 取 控制 
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示 统 知识 时 


续 表 


组 | 安全 级 别 定义 


C2 


受 控 访 问 控制 。 实 际 上 是 安全 产品 的 最 低档 次 ,提供 受 控 的 存 取保 护 
以 用 户 为 单位 


， 存 取 控 制 


| 


控制 ， 数 据 的 保护 以 用 户 组 为 单位 


只 提供 了 非常 初级 的 自主 安全 保护 , 能 实现 对 用 户 和 数据 的 分 离 , 进行 自主 存 取 


2. 信息 安全 


最 低级 别 ， 保 护 措施 很 小 ， 没 有 安全 功能 


信息 安全 的 5 个 基本 要 素 为 机 密 性 、 完 整 性 、 可 用 性 、 可 控 性 和 可 审查 性 。 


(1) 机 密 性 。 
(2) 完整 性 。 
(3) 可 用 性 。 
(4) 可 控 性 。 
(5) 


| 到 


确保 信息 不 暴露 给 未 授权 的 实体 或 进程 。 


只 有 得 到 允许 的 人 才能 修改 数据 ， 并 能 够 判别 出 数据 是 否 已 被 算 改 。 


得 到 授权 的 实体 在 需要 时 可 访问 数据 。 
可 以 控制 授权 范围 内 的 信息 流向 及 行为 方式 。 


J 审查 性 。 对 出 现 的 安全 问题 提供 调查 的 依据 和 手段 。 


随 着 信息 交换 的 激增 ， 安 全 威胁 所 造成 的 危害 越 来 越 被 受到 重视 ， 因 此 对 信息 保密 的 需求 
也 从 军事 、 政 治 和 外 交 等 领域 迅速 扩展 到 民用 和 商用 领域 。 所 谓 安全 威胁 ， 是 指 某 


事件 对 某 一 资源 的 机 密 性 、 完 整 性 、 可 用 性 或 合法 性 所 造成 的 危害 。 某 种 攻 刘 


个 人 、 物 、 


就 是 威胁 的 具体 


实现 。 安 全 威胁 分 为 两 类 : 故意 (如 黑客 渗透 ) 和 偶然 (如 信息 发 往 错 误 的 地 址 〉。 
典型 的 安全 威胁 举例 如 表 1-7 所 示 。 


表 1-7 典型 的 安全 威胁 


威胁 说 了 明 

授权 侵犯 为 某 一 特权 使 用 一 个 系统 的 人 却 将 该 系统 用 作 其 他 未 授权 的 目的 

拒绝 服务 对 信息 或 其 他 资源 的 合法 访问 被 无 条 件 地 拒绝 ， 或 推迟 与 时 间 密 切 相 关 的 操作 
窃听 计 息 从 被 监视 的 通信 过 程 中 泄漏 出 去 

信息 泄露 信息 被 泄漏 或 暴露 给 某 个 未 授权 的 实体 

截获 /修改 某 一 通信 数据 项 在 传输 过 程 中 被 改变 、 删 除 或 替代 

假冒 一 个 实体 (人 或 系统 ) 假装 成 男 一 个 实体 

否认 参与 某 次 通信 交换 的 一 方 否认 曾 发 生 过 此 次 交换 

非法 使 资源 被 某 个 未 授权 的 人 或 者 未 授权 的 方式 使 用 

人 员 朴 忽 一 个 授权 的 人 为 了 金钱 或 利益 ， 或 由 于 粗心 将 信息 泄露 给 未 授权 的 人 
完整 性 破坏 | 通过 对 数据 进行 未 授权 的 创建 、 修 改 或 破坏 ， 使 数据 的 一 致 性 受到 损坏 
媒体 清理 信息 被 从 废弃 的 或 打印 过 的 媒体 中 获得 

物理 入 侵 一 个 入 侵 者 通过 绕 过 物理 控制 而 获得 对 系统 的 访问 

资源 耗 尽 某 一 资源 《如 访问 端口 ) 被 故意 超 负荷 地 使 用 ， 导 致 其 他 用 户 的 服务 被 中 断 
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3 影响 数据 安全 的 因素 


影响 数据 安全 的 因素 有 内 部 因素 和 外 部 因素 两 类 。 

(1) 内 部 因素 。 可 采用 多 种 技术 对 数据 加 密 ， 制定 数据 安全 规划 ; 建立 安全 存储 体系 ， 包 
括 容量 、 容 错 数 据 保护 和 数据 备份 等 ， 建 立 事故 应 急 计 划 和 容 灾 措施 ， 重 视 安全 管理 ， 制 定数 
据 安全 管理 规范 。 

(2) 外 部 因素 。 可 将 数据 分 成 不 同 的 密级 ， 规 定 外 部 使 用 员 的 权限 。 设 置身 份 认证 、 密 码 、 
设置 口令 、 设 置 指纹 和 声 纹 笔迹 等 多 种 认证 。 设 置 防火 墙 ， 为 计算 机 建立 一 道 屏 障 ， 防 止 外 部 
入 侵 破 坏 数据 。 建 立 入 侵 检测 、 审 计 和 追踪 ， 对 计算 机 进行 防卫 。 同 时 ， 也 包括 计算 机 物理 环 
境 的 保障 、 防 辐射 、 防 水 和 防火 等 外 部 防 灾 措 施 。 


1.3.2 加密 技术 和 认证 技术 


1， 加密 技术 


加 密 技术 是 最 常用 的 安全 保密 手段 ， 数 据 加 密 技术 的 关键 在 于 加 密 /解密 算法 和 密 钥 管理 。 
数据 加 密 的 基本 过 程 就 是 对 原来 为 明文 的 文件 或 数据 按 某 种 加 密 算法 进行 处 理 ， 使 其 成 为 不 可 
读 的 一 段 编码 ， 通 常 称 为 “ 密 文 ”。“ 密 文 ”只 能 在 输入 相应 的 密 钥 之 后 才能 显示 出 原来 的 内 
容 ， 通 过 这 样 的 途径 使 数据 不 被 窃取 。 

数据 加 密 和 数据 解密 是 一 对 逆 过 程 。 数 据 加 密 是 用 加 密 算法 E 和 加 密 密 钥 K 将 明文 已 变 


换 成 密 文 C， 记 为 
C=Exr (P) 
数据 解密 是 数据 加 密 的 逆 过 程 ， 解 密 算法 D 和 解密 密 钥 K, 将 密 文 C 变换 成 明文 P ， 记 为 
P=Dx, (C) 


在 安全 保密 中 ， 可 通过 适当 的 密 钥 加 密 技 术 和 管理 机 制 来 保证 网 络 信息 的 通信 安全 。 密 钥 
加 密 技术 的 密码 体制 分 为 对 称 密 钥 体制 和 非 对 称 密 钥 体制 两 种 。 相 应 地 ， 对 数据 加 密 的 技术 分 
为 两 类 ， 即 对 称 加 密 〈 私 有 密 钥 加 密 ) 和 非 对 称 加 密 〈 公 开 密 钥 加 密 ) 。 

1) 对 称 加 密 技 术 

对 称 加 密 采 用 了 对 称 密码 编码 技术 ， 其 特点 是 文件 加 密 和 解密 使 用 相同 的 密 钥 ， 这 种 方法 
在 密码 学 中 叫 作 对 称 加 密 算法 。 

常用 的 对 称 加 密 算法 有 如 下 几 种 。 

(1) 数据 加 密 标 准 (Digital Encryption Standard，DES) 算法 。DES 主要 采用 替换 和 移 位 的 
方法 加 密 。 它 用 56 位 密 钥 对 64 位 二 进 制 数据 块 进行 加 密 ， 每 次 加 密 可 对 64 位 的 输入 数据 进 
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行 16 轮 编码 ， 经 一 系列 替换 和 移 位 后 ， 输 入 的 64 位 原始 数据 转换 成 完全 不 同 的 64 位 输出 数 
据 。DES 算法 运算 速度 快 ， 密 钥 生 产 容 易 ， 适 合 于 在 当前 大 多 数 计算 机 上 用 软件 方法 实现 ， 同 
时 也 适合 于 在 专用 芯片 上 实现 。 
(2) 三 重 DES (3DES， 或 称 TDEA) 。 在 DES 的 基础 上 采用 三 重 DES， 即 用 两 个 56 位 
的 密 钥 Kl 和 Ks， 发送 方 用 Kl 加密 ,Ks 解密 ,再 使 用 Ki 加密 。 接 收 方 则 使 用 Ki 解密 ,Ks 加密， 
再 使 用 K 解密 ， 其 效果 相当 于 将 密 钥 长 度 加 倍 。 

(3) RC-5 (Rivest Cipher 5) 。RC-5 是 由 Ron Rivest〈 公 钥 算法 的 创始 人 之 一 ) 在 1994 年 
开发 出 来 的 。RC-5 是 在 RCF2040 中 定义 的 ，RSA 数据 安全 公司 的 很 多 产品 都 使 用 了 RC-5。 

(4) 国际 数据 加 密 算法 (International Data Encryption Adleman，IDEA) 。IDEA 是 在 DES 
算法 的 基础 上 发 展 起 来 的 ， 类 似 于 三 重 DES。IDEA 的 密 钥 为 128 位 ， 这 么 长 的 密 钥 在 今后 若 
干 年 内 应 该 是 安全 的 。 类 似 于 DES，IDEA 算法 也 是 一 种 数据 块 加 密 算法 ， 它 设计 了 一 系列 加 
密 轮 次 , 每 轮 加 密 都 使 用 从 完整 的 加 密 密 钥 中 生成 的 一 个 子 密 钥 。IDEA 加 密 标准 由 PGP (Pretty 
Good Privacy) 系统 使 用 。 

(5) 高 级 加 密 标准 (Advanced Encryption Standard，AES) 算法 。AES 算法 基于 排列 和 置 
换 运算 。 排 列 是 对 数据 重新 进行 安排 ， 置 换 是 将 一 个 数据 单元 替换 为 另 一 个 。AES 使 用 几 种 不 
同 的 方法 来 执行 排列 和 置换 运算 。 

AES 是 一 个 迭代 的 、 对 称 密 钥 分 组 的 密码 ， 它 可 以 使 用 128、192 和 256 位 密 钥 ， 并 且 
用 128 位 (16 字 节 ) 分 组 加 密 和 解密 数据 。 

2) 非 对 称 加 密 技术 

与 对 称 加 密 算 法 不 同 ， 非 对 称 加 密 算法 需要 两 个 密 钥 : 公开 密 钥 (Publickey) 和 私有 密 钥 
(Privatekey) 。 公 开 密 钥 与 私有 密 钥 是 一 对 ， 如 果 用 公开 密 钥 对 数据 进行 加 密 ， 只 有 用 对 应 的 私 
有 密 钥 才能 解密 ; 如 果 用 私有 密 钥 对 数据 进行 加 密 ， 那 么 只 有 用 对 应 的 公开 密 钥 才能 解密 。 因 为 
加 密 和 解密 使 用 的 是 两 个 不 同 的 密 钥 ， 所 以 这 种 算法 称 为 非 对 称 加 密 算法 。 


非 对 称 加 密 有 两 个 不 同 的 体制 ， 如 图 1-15 所 示 。 
B 的 公 钥 B 的 私 钥 A 的 私 钥 A 的 公 钥 
明文 | 密 文 | 明 明文 ! 密 文 明文 
一 | A 加 密 B 解 密 [一 一 -| A 加 密 B 解 密 ” 一 
(a) 加 密 模型 (Cb) 认证 模型 


图 1-15 ” 非 对 称 加 密 体制 模型 


非 对 称 加 密 算法 实现 机 密 信息 交换 的 基本 过 程 是 : 甲 方 生成 一 对 密 钥 并 将 其 中 的 一 把 作为 
公用 密 钥 向 其 他 方 公开 ;得 到 该 公用 密 钥 的 乙方 使 用 该 密 钥 对 机 密 信息 进行 加 密 后 再 发 送 给 甲 
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方 ; 甲 方 再 用 自己 保存 的 另 一 把 专用 密 钥 对 加 密 后 的 信息 进行 解密 。 

非 对称 加 密 算法 的 保密 性 比较 好 ， 它 消除 了 最 终 用 户 交换 密 钥 的 需要 ,但 加 密 和 解密 花费 
时 间 长 、 速 度 慢 ， 不 适合 于 对 文件 加 密 ， 而 只 适用 于 对 少量 数据 进行 加 密 。 

RSA (Rivest，Shamir and Adleman) 算法 是 一 种 公 钥 加 密 算法 ， 它 按照 下 面 的 要 求 选择 公 

(1) 选择 两 个 大 素数 p 和 g (大 于 10'”) 。 

(2) 令 n=pXg 和 有 =(p-1)X(qg-1)。 

(3) 选择 d 与 z 互 质 。 

(4) 选择 e， 使 eXd=1(mod z)。 

加 密 时 对 明文 P 进 行 以 下 计算 得 到 密 文 C: 

C=P'(mod n) 


这 样 公 钥 为 (e,n) 。 解 密 时 计算 
P=C‘(mod n) 
即 私 钥 为 (4d,n) 。 

例如 ， 设 p=3，g=11，n=33，z=20，d=7，e=3，C=Pi(mod 33)，P=C (mod 33)， 则 有 

C=23(mod 33)=8(mod 33)=8 

P=8’(mod 33)=2097152(mod 33)=2 

RSA 算法 的 安全 性 是 基于 大 素数 分 解 的 困难 性 。 攻 击 者 可 以 分 解 已 知 的 n， 得 到 p 和 gq， 
然后 可 得 到 z， 最 后 用 Euclid 算法 ， 由 e 和 = 得 到 4。 但 是 要 分 解 200 位 的 数 ， 需 要 40 亿 年 ; 
分 解 500 位 的 数 ， 则 需要 10” 年 。 

3) 密 钥 管理 

密 钥 是 有 生命 周期 的 ， 它 包括 密 钥 和 证 书 的 有 效 时 间 ， 以 及 已 撤销 密 钥 和 证 书 的 维护 时 间 
等 。 密 钥 既 然 要 求 保密 ， 这 就 涉及 密 钥 的 管理 问题 ， 任 何 保密 也 只 是 相对 的 ， 是 有 时 效 的 。 密 
钥 管 理 主要 是 指 密 钥 对 的 安全 管理 ， 包 括 密 钥 产 生 、 密 钥 备 份 、 密 钥 恢 复 和 密 钥 更 新 等 。 

(1) 密 钥 产生 。 密 钥 对 的 产生 是 证 书 申请 过 程 中 重要 的 一 步 , 其 中 产生 的 私 钥 由 用 户 保留 ， 
公 钥 和 其 他 信息 则 交 于 CA〈Certificate Authority) 中 心 进行 签名 ， 从 而 产生 证 书 。 根 据 证 书 类 
型 和 应 用 的 不 同 ， 密 钥 对 的 产生 也 有 不 同 的 形式 和 方法 。 对 普通 证 书 和 测试 证 书 ， 一 般 由 浏览 
器 或 固定 的 终端 应 用 来 产生 ， 这 样 产生 的 密 钥 强度 较 小 ， 不 适合 应 用 于 比较 重要 的 安全 网 络 交 
易 。 而 对 于 比较 重要 的 证 书 ， 如 商家 证 书 和 服务 器 证 书 等 ， 密 钥 对 一 般 由 专用 应 用 程序 或 CA 
中 心 直 接 产生 ， 这 样 产生 的 密 钥 强度 大 ， 适 合 于 重要 的 应 用 场合 。 

另外 ， 根 据 密 钥 的 应 用 不 同 ， 也 可 能 会 有 不 同 的 产生 方式 。 例 如 ， 签 名 密 钥 可 能 在 客户 端 
或 RA (Register Authority) 中 心 产生 ， 而 加 密 密 钥 则 需要 在 CA 中 心 直 接 产生 。 

(2) 密 钥 备份 和 恢复 。 在 一 个 PKI (Public Key Infrastructure， 公 开 密 钥 体 系 ) 系统 中 ， 维 
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护 密 钥 对 的 备份 至 关 重 要 ， 如果 没有 这 种 措施 ， 当 密 钥 丢失 后 , 将 意味 着 加 密 数 据 的 完全 丢失 ， 
对 于 一 些 重要 数据 ， 这 将 是 灾难 性 的 。 所 以 ， 密 钥 的 备份 和 恢复 也 是 PKI 密 钥 管理 中 的 重要 一 
环 。 换 句 话说， 即使 密 钥 丢失 ， 使 用 PKI 的 企业 和 组 织 必 须 仍 能 够 得 到 确认 ， 受 密 钥 加 密 保护 
的 重要 信息 也 必须 能 够 恢复 。 当 然 ， 不 能 让 一 个 独立 的 个 人 完全 控制 最 重要 的 主 密 钥 ， 否 则 可 
能 引起 严重 后 果 。 

企业 级 的 PKI 产品 至 少 应 该 支持 用 于 加 密 的 安全 密 钥 的 存储 、 备 份 和 恢复 。 密 钥 一 般 用 口 
令 进行 保护 ， 而 口令 丢失 则 是 管理 员 最 常见 的 安全 疏 漏 之 一 。 所 以 ，PKI 产品 应 该 能 够 备份 密 
钥 ， 即 使 口令 丢失 ， 它 也 能 够 让 用 户 在 一 定 条 件 下 恢复 该 密 钥 ， 并 设置 新 的 口令 。 

(3) 密 钥 更 新 。 如 果 用 户 可 以 一 次 又 一 次 地 使 用 同样 密 钥 与 别人 交换 信息 ， 那 么 密 钥 也 同 
其 他 任何 密码 一 样 存在 着 一 定 的 安全 性 问题 ， 虽 然 说 用 户 的 私 钥 是 不 对 外 公开 的 ， 但 是 也 很 难 
保证 私 钥 长 期 的 保密 性 ， 很 难保 证 不 被 泄露 。 如 果 某 人 偶然 地 知道 了 用 户 的 密 钥 ， 那 么 用 户 曾 
经 和 另 一 个 人 交换 的 每 一 条 消息 都 不 再 是 保密 的 了 。 另外 , 使 用 一 个 特定 密 钥 加 密 的 信息 越 多 ， 
提供 给 窃听 者 的 材料 也 就 越 多 ， 从 某 种 意义 上 来 讲 也 就 越 不 安全 了 。 

对 每 一 个 由 CA 颁发 的 证 书 都 会 有 有 效 期 ， 密 钥 对 生命 周期 的 长 短 由 签发 证 书 的 CA 中 心 
来 确定 ， 各 CA 系统 的 证 书 有 效 期 限 有 所 不 同 , 一 般 大 约 为 2 一 3 年 。 当 用 户 的 私 钥 被 泄漏 或 证 
书 的 有 效 期 快 到 时 ， 用 户 应 该 更 新 私 钥 。 这 时 用 户 可 以 废除 证 书 ， 产 生 新 的 密 钥 对 ， 申 请 新 的 
证 书 。 

(4) 多 密 钥 的 管理 。 假 设 在 某 机 构 中 有 100 个 人 ， 如 果 他 们 任意 两 人 之 间 可 以 进行 秘密 对 
话 ， 那 么 总 共 需 要 多 少 密 钥 呢 ? 每 个 人 需要 知道 多 少 密 钥 呢 ? 也 许 很 容易 得 出 答案 ， 如 果 任何 
两 个 人 之 间 要 不 同 的 密 钥 ， 则 总 共 需 要 4950 个 密 钥 ， 而 且 每 个 人 应 记 住 99 个 密 钥 。 如 果 机 构 
的 人 数 是 1000，10 000 人 或 更 多 ， 这 种 办 法 显然 就 过 于 愚 春 了 ， 管 理 密 钥 将 是 一 件 非常 困难 的 
事情 。 为 此 需要 研究 并 开发 用 于 创建 和 分 发 密 钥 的 加 密 安全 的 方法 。 

Kerberos 提供 了 一 种 解决 这 个 问题 的 较 好 方案 , 它 是 由 MIT 发 明 的 ,使 保密 密 钥 的 管理 和 
分 发 变 得 十 分 容易 ， 但 这 种 方法 本 身 还 存在 一 定 的 缺点 。 为 能 在 因特网 上 提供 一 个 实用 的 解决 
方案 ，Kerberos 建立 了 一 个 安全 的 、 可 信任 的 密 钥 分 发 中 心 (Key Distribution Center, KDC) ， 
每 个 用 户 只 要 知道 一 个 和 KDC 进行 会 话 的 密 钥 就 可 以 了 ， 而 不 需要 知道 成 百 上 千 个 不 同 的 
密 钥 。 


2， 认 证 技术 

认证 技术 主要 解决 网 络 通信 过 程 中 通信 双方 的 身份 认可 。 认 证 的 过 程 涉及 加 密 和 密 钥 交 
换 。 通 常 ， 加 密 可 使 用 对 称 加 密 、 不 对 称 加 密 及 两 种 加 密 方法 的 混合 方法 。 认 证 方 一 般 有 账户 
名 /口令 认证 、 使 用 摘要 算法 认证 和 基于 PKI 的 认证 。 
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一 个 有 效 的 PKI 系统 必须 是 安全 的 和 透明 的 , 用 户 在 获得 加 密 和 数字 签名 服务 时 , 不 需要 详 
细 地 了 解 PKI 的 内 部 运作 机 制 。 在 一 个 典型 、 完 整 和 有 效 的 PKI 系统 中 ,除了 具有 证 书 的 创建 和 
发 布 ， 特 别 是 证 书 的 撤销 功能 外 ， 一 个 可 用 的 PKI 产品 还 必须 提供 相应 的 密 钥 管理 服务 ， 包 括 密 
钥 的 备份 、 恢 复 和 更 新 等 。 没 有 一 个 好 的 密 钥 管 理 系统 ， 将 极 大 地 影响 一 个 PKI 系统 的 规模 、 
可 伸缩 性 和 在 协同 网 络 中 的 运行 成 本 。 在 一 个 企业 中 ，PKI 系统 必须 有 能 力 为 一 个 用 户 管理 多 对 
密 钥 和 证 书 ， 能 够 提供 安全 策略 编辑 和 管理 工具 ， 如 密 钥 周期 和 密 钥 用 途 等 。 

PKI 是 一 种 遵循 既定 标准 的 密 钥 管理 平台 ， 能 够 为 所 有 网 络 应 用 提供 加 密 和 数字 签名 等 密 
码 服务 及 所 必需 的 密 钥 和 证 书 管理 体系 。 简 单 来 说 ，PKI 就 是 利用 公 钥 理论 和 技术 建立 的 提供 
安全 服务 的 基础 设施 。PKI 技术 是 信息 安全 技术 的 核心 , 也 是 电子 商务 的 关键 和 基础 技术 。PKI 
的 基础 技术 包括 加 密 、 数 字 签 名 、 数 据 完整 性 机 制 、 数 字 信封 和 双重 数字 签名 等 。 完 整 的 PKI 
系统 必须 具有 权威 认证 机 构 (CA) 、 数 字 证 书库 、 密 钥 备 份 及 恢复 系统 、 证 书 作废 系统 、 应 用 
接口 (Application Programming Interface，API) 等 基本 构成 部 分 。 

(1) 认证 机 构 。 即 数字 证 书 的 申请 及 签发 机 关 ，CA 必须 具备 权威 性 的 特征 。 

(2) 数字 证 书库 。 用 于 存储 已 签发 的 数字 证 书 及 公 钥 ， 用 户 可 由 此 获得 所 需 的 其 他 用 户 的 
证 书 及 公 钥 。 

(3) 密 钥 备份 及 恢复 系统 。 如 果 用 户 丢 失 了 用 于 解密 数据 的 密 钥 ， 则 数据 将 无 法 被 解密 ， 
这 将 造成 合法 数据 丢失 。 为 避免 这 种 情况 ，PKI 提供 备份 与 恢复 密 钥 的 机 制 。 但 须 注意 ， 密 钥 
的 备份 与 恢复 必须 由 可 信 的 机 构 来 完成 。 并 且 ， 密 钥 备 份 与 恢复 只 能 针对 解密 密 钥 ， 签 名 私 钥 
为 确保 其 唯一 性 而 不 能 够 作 备份 。 

(4) 证 书 作废 系统 。 证 书 作 废 处 理 系统 是 PKI 的 一 个 必 备 组 件 。 与 日 常生 活 中 的 各 种 身份 
证 件 一 样 ， 证 书 有 效 期 以 内 也 可 能 需要 作废 ， 原 因 可 能 是 密 钥 介质 丢失 或 用 户 身份 变更 等 。 为 
实现 这 一 点 ，PKI 必须 提供 作废 证 书 的 一 系列 机 制 。 

(5) 应 用 接口 。PKI 的 价值 在 于 使 用 户 能 够 方便 地 使 用 加 密 、 数 字 签 名 等 安全 服务 ， 因 此 
一 个 完整 的 PKI 必须 提供 良好 的 应 用 接口 系统 ， 使 得 各 种 各 样 的 应 用 能 够 以 安全 、 一 致 、 可 信 
的 方式 与 PKI 交互 ， 确 保安 全 网 络 环境 的 完整 性 和 易 用 性 。 

PKI 采用 证 书 进行 公 钥 管理 ， 通 过 第 三 方 的 可 信任 机 构 〈 认 证 中 心 ， 即 CA) 把 用 户 的 公 
钥 和 用 户 的 其 他 标识 信息 捆绑 在 一 起 ， 其 中 包括 用 户 名 和 电子 邮件 地 址 等 信息 ， 以 在 Internet 
上 验证 用 户 的 身份 。PKI 把 公 钥 密码 和 对 称 密码 结合 起 来 ， 在 Internet 上 实现 密 钥 的 自动 管理 ， 
网 上 数据 的 安全 传输 。 

因此 ， 从 大 的 方面 来 说 ， 所 有 提供 公 钥 加 密 和 数字 签名 服务 的 系统 ， 都 可 归结 为 PKI 系统 
一 部 分 ，PKI 的 主要 目的 是 通过 自动 管理 密 钥 和 证 书 ， 为 用 户 建立 起 一 个 安全 的 网 络 运行 环 
使 用 户 可 以 在 多 种 应 用 环境 下 方便 地 使 用 加 密 和 数字 签名 技术 ， 从 而 保证 网 上 数据 的 机 密 
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性 、 完 整 性 和 有 效 性 。 数 据 的 机 密 性 是 指数 据 在 传输 过 程 中 不 能 被 非 授权 者 偷 看 ， 数 据 的 完整 
性 是 指数 据 在 传输 过 程 中 不 能 被 非法 算 改 ;数据 的 有 效 性 是 指数 据 不 能 被 否认 。 

PKI 发 展 的 一 个 重要 方面 就 是 标准 化 问题 ， 它 也 是 建立 互 操作 性 的 基础 。 目 前 ，PKI 标准 
化 主要 有 两 个 方面 :一 是 RSA 公司 的 公 钥 加 密 标准 (Public Key Cryptography Standards, PKCS )， 
它 定义 了 许多 基本 PKI 部 件 ， 包 括 数字 签名 和 证 书 请 求 格式 等 ， 二 是 由 Internet 工程 任务 组 
(Internet Engineering Task Force, IETF) 和 PKI 工作 组 (Public Key Infrastructure Working Group， 
PKIX) 所 定义 的 一 组 具有 互 操作 性 的 公 钥 基础 设施 协议 。 在 今后 很 长 的 一 段 时 间 内 ，PKCS 和 
PKIX 将 会 并 存 ， 大 部 分 的 PKI 产品 为 保持 兼容 性 ， 也 将 会 对 这 两 种 标准 进行 支持 。 

1) Hash 函数 与 信息 摘要 (Message Digest) 

Hash 哈 希 ) 函数 提供 了 这 样 一 种 计算 过 程 : 输入 一 个 长 度 不 固定 的 字符 串 ， 返 回 一 串 固 
定 长 度 的 字符 串 ， 又 称 Hash 值 。 单 向 Hash 函数 用 于 产生 信息 摘要 。Hash 函数 主要 可 以 解决 以 
下 两 个 问题 : 在 某 一 特定 的 时 间 内 ， 无 法 查找 经 Hash 操作 后 生成 特定 Hash 值 的 原 报 文 ， 也 无 
法 查找 两 个 经 Hash 操作 后 生成 相同 Hash 值 的 不 同 报 文 。 这 样 ， 在 数字 签名 中 就 可 以 解决 验证 
签名 和 用 户 身份 验证 、 不 可 抵赖 性 的 问题 。 

信息 摘要 简要 地 描述 了 一 份 较 长 的 信息 或 文件 , 它 可 以 被 看 作 一 份 长 文件 的 “数字 指纹 ”。 
信息 摘要 用 于 创建 数字 签名 , 对 于 特定 的 文件 而 言 , 信息 摘要 是 唯一 的 。 信 息 摘 要 可 以 被 公 
它 不 会 透露 相应 文件 的 任何 内 容 。MD2、MD4 和 MD5 (MD 表示 信息 摘要 ) 是 由 Ron Rivest 
设计 的 专门 用 于 加 密 处 理 的 ， 并 被 广泛 使 用 的 Hash 函数 ， 它 们 产生 一 种 128 位 的 信息 摘要 ， 
除 彻底 地 搜寻 外 ， 没 有 更 快 的 方法 对 其 加 以 攻击 ， 而 其 搜索 时 间 一 般 需 要 1025 年 之 久 。 

2) 数字 签名 

数字 签名 主要 经 过 以 下 几 个 过 程 。 

(1) 信息 发 送 者 使 用 一 个 单 向 散 列 函数 〈Hash 函数 ) 对 信息 生成 信息 摘要 。 

(2) 信息 发 送 者 使 用 自己 的 私 钥 签 名 信息 摘要 。 

(3) 信息 发 送 者 把 信息 本 身 和 已 签名 的 信息 摘要 一 起 发 送出 去 。 

(4) 信息 接收 者 通过 使 用 与 信息 发 送 者 使 用 的 同一 个 单 向 散 列 函 数 (Hash 函数 ) 对 接收 的 
信息 本 身 生 成 新 的 信息 摘要 ， 再 使 用 信息 发 送 者 的 公 钥 对 信息 摘要 进行 验证 ， 以 确认 信息 发 送 
者 的 身份 和 信息 是 否 被 修改 过 。 

数字 加 密 主要 经 过 以 下 几 个 过 程 。 

(1) 当 信 息 发 送 者 需要 发 送信 息 时 ， 首 先生 成 一 个 对 称 密 钥 ， 用 该 对 称 密 钥 加 密 要 发 送 的 
报 文 。 

(2) 信息 发 送 者 用 信息 接收 者 的 公 钥 加 密 上 述 对 称 密 钥 。 

(3) 信息 发 送 者 将 第 (1) 步 和 第 (2) 步 的 结果 结合 在 一 起 传 给 信息 接收 者 ， 称 为 数字 
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言 封 。 

(4) 信息 接收 者 使 用 自己 的 私 钥 解密 被 加 密 的 对 称 密 钥 ， 再 用 此 对 称 密 钥 解密 被 发 送 方 加 
密 的 密 文 ， 得 到 真正 的 原文 。 

数字 签名 和 数字 加 密 的 过 程 虽然 都 使 用 公开 密 钥 体系 ， 但 实现 的 过 程 正 好 相反 ， 使 用 的 密 
钥 对 也 不 同 。 数 字 签名 使 用 的 是 发 送 方 的 密 钥 对 ， 发 送 方 用 自己 的 私有 密 钥 进行 加 密 ， 接 收 方 
用 发 送 方 的 公开 密 钥 进行 解密 ， 这 是 一 个 一 对 多 的 关系 ， 任 何 拥有 发 送 方 公开 密 钥 的 人 都 可 以 
验证 数字 签名 的 正确 性 。 数 字 加 密 则 使 用 的 是 接收 方 的 密 钥 对 ， 这 是 多 对 一 的 关系 ， 任 何 知道 
接收 方 公开 密 钥 的 人 都 可 以 向 接收 方 发 送 加密 信 息 ， 只 有 唯一 拥有 接收 方 私有 密 钥 的 人 才能 对 
信息 解密 。 另 外 ， 数 字 签 名 只 采用 了 非 对 称 密 钥 加 密 算法 ， 它 能 保证 发 送信 息 的 完整 性 、 身 份 
认证 和 不 可 否认 性 ， 而 数字 加 密 采 用 了 对 称 密 钥 加 密 算法 和 非 对 称 密 钥 加 密 算法 相 结合 的 方 
法 ， 它 能 保证 发 送信 息 的 保密 性 。 

3) SSL 协议 

SSL (Secure Sockets Layer， 安 全 套 接 层 ) 协议 最 初 是 由 Netscape Communication 公司 设计 
开发 的 ， 主 要 用 于 提高 应 用 程序 之 间 数 据 的 安全 系数 。SSL 协议 可 以 被 概括 为 是 一 个 保证 任何 
安装 了 安全 套 接 字 的 客户 和 服务 器 间 事 务 安全 的 协议 ， 它 涉及 所 有 TCP/IP 应 用 程序 。SSL 协 
议 主 要 提供 如 下 三 方面 的 服务 。 

(1) 用 户 和 服务 器 的 合法 性 认证 。 认 证 用 户 和 服务 器 的 合法 性 ， 使 得 它们 能 够 确信 数据 将 
被 发 送 到 正确 的 客户 端 和 服务 器 上 。 客 户 端 和 服务 器 都 是 有 各 自 的 识别 号 ， 这 些 识别 号 由 公 
密 钥 进行 编号 , 为 了 验证 用 户 是 否 合法 , 安全 套 接 层 协议 要 求 在 握手 交换 数据 时 进行 数字 认证 ， 
以 此 来 确保 用 户 的 合法 性 。 

(2) 加 密 数 据 以 隐藏 被 传送 的 数据 ,安全 套 接 层 协议 所 采用 的 加 密 技术 既 有 对 称 密 钥 技术 ， 
也 有 公开 密 钥 技术 。 在 客户 端 与 服务 器 进行 数据 交换 之 前 ， 交 换 SSL 初始 握手 信息 ， 在 SSL 
担 手 信息 中 采用 了 各 种 加 密 技 术 对 其 加 密 ， 以 保证 机 密 性 和 数据 的 完整 性 ， 并 且 用 数字 证 书 进 
行 鉴别 ， 这 样 就 可 以 防止 非法 用 户 进行 破译 。 

(3) 保护 数据 的 完整 性 。 安 全 套 接 层 协议 采用 Hash 函数 和 机 密 共 享 的 方法 来 提供 信息 的 
完整 性 服务 ， 建 立 客户 端 与 服务 器 之 间 的 安全 通道 ， 使 所 有 经 过 安全 套 接 层 协议 处 理 的 业务 在 
传输 过 程 中 能 全 部 完整 准确 无 误 地 到 达 目 的 地 。 

安全 套 接 层 协议 是 一 个 保证 计算 机 通信 安全 的 协议 ， 对 通信 对 话 过 程 进行 安全 保护 ， 其 实 
现 过 程 主要 经 过 如 下 几 个 阶段 。 

(1) 接 通 阶段 。 客 户 端 通过 网 络 向 服务 器 打招呼 ， 服 务 器 回应 。 

(2) 密码 交换 阶段 。 客 户 端 与 服务 器 之 间 交 换 双方 认可 的 密码 ， 一 般 选用 RSA 密码 算法 ， 
也 有 的 选用 Diffie-Hellmanf 和 Fortezza-KEA 密码 算法 。 
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(3) 会 谈 密码 阶段 。 客 户 端 与 服务 器 间 产 生 彼此 交谈 的 会 谈 密 码 。 

(4) 检验 阶段 。 客 户 端 检验 服务 器 取得 的 密码 。 

(5) 客户 认证 阶段 。 服 务 器 验证 客户 端的 可 信 度 。 

(6) 结束 阶段 。 客 户 端 与 服务 器 之 间 相互 交换 结束 的 信息 。 

当 上 述 动作 完成 之 后 ， 两 者 间 的 资料 传送 就 会 加 密 ， 另 外 一 方 收 到 资料 后 ， 再 将 编码 资料 
还 原 。 即 使 盗窃 者 在 网 络 上 取得 编码 后 的 资料 ， 如 果 没 有 原先 编制 的 密码 算法 ， 也 不 能 获得 可 
读 的 有 用 资料 。 

发 送 时 ， 信 息 用 对 称 密 钥 加 密 ， 对 称 密 钥 用 非 对 称 算法 加 密 ， 再 把 两 个 包 绑 在 一 起 传送 过 
去 。 接 收 的 过 程 与 发 送 正好 相反 ， 先 打开 有 对 称 密 钥 的 加 密 包 ， 再 用 对 称 密 钥 解密 。 

在 电子 商务 交易 过 程 中 , 由 于 有 银行 参与 , 按照 SSL 协议 , 客户 的 购买 信息 首先 发 往 商家 ， 
商家 再 将 信息 转发 银行 ， 银 行 验证 客户 信息 的 合法 性 后 ， 通 知 商家 付款 成 功 ， 商 家 再 通知 客户 
购买 成 功 ， 并 将 商品 寄 送 客户 。 

4) 数字 时 间 戳 技术 

数字 时 间 戳 就 是 数字 签名 技术 的 一 种 变种 应 用 。 在 电子 商务 交易 文件 中 ， 时 间 是 十 分 重要 
的 信息 。 在 书面 合同 中 ， 文 件 签署 的 日 期 和 签名 一 样 均 是 十 分 重要 的 防止 文件 被 伪造 和 算 改 的 
关键 性 内 容 。 数 字 时 间 稚 服务 (Digital Time Stamp Service，DTS) 是 网 上 电子 商务 安全 服务 项 
目 之 一 ， 能 提供 电子 文件 的 日 期 和 时 间 信 息 的 安全 保护 。 

时 间 惟 是 一 个 经 加 密 后 形成 的 凭证 文档， 包括 如 下 三 个 部 分 。 

(1) 需 加 时 间 戳 的 文件 的 摘要 (Digest〉。 

(2) DTS 收 到 文件 的 日 期 和 时 间 。 

(3) DTS 的 数字 签名 。 

一 般 来 说 ， 时 间 戳 产生 的 过 程 为 : 用 户 首先 将 需要 加 时 间 戳 的 文件 用 Hash 编码 加 密 形成 
摘要 ， 然 后 将 该 摘要 发 送 到 DTS，DTS 在 加 入 了 收 到 文件 摘要 的 日 期 和 时 间 信 息 后 再 对 该 文件 
加 密 〈 数 字 签名 ) ， 然 后 送 回 用 户 。 

书面 签署 文件 的 时 间 是 由 签署 人 自己 写 上 的 ， 而 数字 时 间 戳 则 是 由 认证 单位 DTS 来 加 入 
的 ， 以 DTS 收 到 文件 的 时 间 为 依据 。 


1.3.3 ”计算 机 可 靠 性 


1. 计算 机 可 靠 性 概述 


计算 机 系统 的 硬件 故障 通常 是 由 元 器 件 的 失效 引起 的 。 对 元 器 件 进行 寿命 试验 并 根据 实际 
资料 统计 得 知 ， 元 器 件 的 可 靠 性 可 分 成 三 个 阶段 : 开始 阶段 器 件 工作 处 于 不 稳定 期 ， 失 效率 较 
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高 ; 第 二 阶段 器 件 进入 正常 工作 期 ， 失 效率 最 低 ， 基 本 保持 常数 ， 第 三 阶段 元 器 件 开始 老化 ， 
失效 率 又 重新 提高 。 这 就 是 所 谓 的 “浴盆 曲线 ”。 因 此 ， 应 保证 在 计算 机 中 使 用 的 元 器 件 处 于 
第 二 阶段 。 在 第 一 阶段 应 对 元 器 件 进行 老化 筛选 ， 而 到 了 第 三 个 阶段 ， 则 淘汰 该 计算 机 。 

计算 机 系统 的 可 靠 性 是 指 从 它 开始 运行 (上 = 0 ) 到 某 时 刻 1 这 段 时 间 内 能 正常 运行 的 概率 ， 
用 RC) 表示 。 所 谓 失 效率 ， 是 指 单位 时 间 内 失效 的 元 件数 与 元 件 总 数 的 比例 ,用 4 表示， 当 4 
为 常数 时 ， 可 靠 性 与 失效 率 的 关系 为 


R(t)=e* 
典型 的 失效 率 与 时 间 的 关系 曲线 如 图 1-16 所 示 。 
1 


0 | i 
初始 ! 随机 | 损耗 
图 1-16 失效 率 特性 


两 次 故障 之 间 系统 能 正常 工作 的 时 间 的 平均 值 称 为 平均 无 故障 时 间 (MTBF) ， 即 
MTBF=1/4 
通常 用 平均 修复 时 间 (MTRF) 来 表示 计算 机 的 可 维修 性 ， 即 计算 机 的 维修 效率 ， 指 从 故 
障 发 生 到 机 器 修复 平均 所 需要 的 时 间 。 计 算 机 的 可 用 性 是 指 计算 机 的 使 用 效率 ， 它 以 系统 在 执 
行 任务 的 任意 时 刻 能 正常 工作 的 概率 4 来 表示 ， 即 
MTBF 
”MTBF+MTRF 
计算 机 的 RAS 就 是 指 用 可 靠 性 R、 可 用 性 4 和 可 维修 性 8 三 个 指标 衡量 一 个 计算 机 系统 。 
但 在 实际 应 用 中 , 引起 计算 机 故障 的 原因 除了 元 器 件 以 外 还 与 组 装 工艺 、 逻辑 设计 等 因素 有 关 。 
因此 , 不 同 厂家 生产 的 兼容 机 , 即使 采用 相同 的 元 器 件 , 其 可 靠 性 及 MTBF 也 可 能 会 相差 很 大 。 


2. 计算 机 可 靠 性 模型 


计算 机 系统 是 一 个 复杂 的 系统 ， 而 且 影响 其 可 靠 性 的 因素 也 非常 繁复 ， 很 难 直接 对 其 进行 
可 靠 性 分 析 。 但 通过 建立 适当 的 数学 模型 , 把 大 系统 分 割 成 若干 子 系统 ， 可 以 简化 其 分 析 过 程 。 
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常见 的 系统 可 靠 性 数学 模型 有 以 下 三 种 。 
(1) 串联 系统 。 假设 一 个 系统 由 个子 系统 组 成 , 当 且 仅 当 所 有 的 子 系统 都 能 正常 工作 时 ， 
系统 才能 正常 工作 ， 这 种 系统 称 为 串联 系统 ， 如 图 1-17 所 示 。 


输入 一 一 RI = RR mv = Ry 一 一 输出 


图 1-17 ”串联 系统 的 可 靠 性 模型 


设 系统 中 各 个 子 系统 的 可 靠 性 度量 值 分 别 用 R, R,,… ,Rw 来 表示 ，, 则 系统 的 可 靠 性 R 度量 
值 由 下 式 求 得 。 


R= RR,*… Ry 
如 果 系 统 的 各 个 子 系统 的 失效 率 分 别 用 4, 罗 ,…, A 来 表示 ， 则 系统 的 失效 率 4 可 由 下 式 
求 得 。 
1 全 1 十 … 十 办 
例如 ， 设 某 计算 机 系统 由 CPU、 存 储 器 、LO 三 部 分 组 成 ， 其 可 靠 性 分 别 为 0.95，0.90 和 
0.85。 则 该 计算 机 系统 的 可 靠 性 度量 值 为 R= Ri*R2*Rs= 0.95X0.90X0.85=0.73。 
(2) 并 联系 统 。 假 如 一 个 系统 由 N 个 子 系统 组 成 ， 只 要 有 一 个 子 系统 正常 工作 ， 系 统 就 能 
正常 工作 ， 这 样 的 系统 称 为 并 联系 统 ， 如 图 1-18 所 示 。 设 


每 个 子 系统 的 可 靠 性 度量 值 分 别 以 R,R,,… ,Ry 表示 , 整个 “| A 
系统 的 可 靠 性 度量 值 由 下 式 来 求 得 。 | 
R=1-(1-R)(-R,) (Ry) 输入 | 已 [一 输出 

假如 所 有 子 系统 的 失效 率 均 为 4 ， 则 系统 的 失效 率 : | 

XA 为 =| Ry 
__l 
ITl 图 1-18 并 联系 统 的 可 靠 性 模型 
4 


在 并 联系 统 中 只 有 一 个 子 系统 是 真正 需要 的 ， 其 余 V-1 个 子 系统 称 为 元 余子 系统 ， 随 着 
宛 余子 系统 数量 的 增加 ， 系 统 的 平均 无 故障 时 间 也 增加 了 。 

【 例 1.7】 设 某 系统 由 三 个 相同 子 系统 构成 ， 每 个 子 系统 的 可 靠 性 度量 值 为 0.9、 平 均 无 故 
障 时 间 (MTBF) 为 10 000 小 时 ， 求 系统 的 可 靠 性 和 平均 无 故障 时 间 。 

解 : R=R,=R=0.9 失效 率 1= 略 = 邦 = 因 =1/10000=1X10” 

系统 可 靠 性 度量 值 R=1-(1-R)? =0.999 

系统 平均 无 故障 时 间 为 
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MTBF = 二 = -lxa+l +D= 18333 (小 时 ) 
Hu 4 4 

(3) N 模 宛 余 系统 。 N 模 宛 余 系统 由 N 个 

( W=2n+1 ) 相同 的 子 系统 和 一 个 表决 器 组 成 ， 表 

决 器 把 NN 个 子 系统 中 占 多 数 相同 结果 的 输出 作为 (9 a 


系统 的 输出 ， 如 图 1-19 所 示 。 输入 


在 入 个 子 系统 中 ， 只 要 有 n+1 个 或 n+1 个 以 : 
上 子 系统 能 正常 工作 ， 系 统 就 能 正常 工作 ， 输 出 正 四 
确 的 结果 。 假 设 表决 器 是 完全 可 靠 的 ， 每 个 子 系 关 
统 的 可 靠 性 为 R  ， 则 N 模 宛 余 系 统 的 可 靠 性 度量 I 
值 为 


R(x Rm) 


i=n+]1 
其 中 ， (未 从 个 元 中 到 :个 元 素 的 组 全 娄 


提高 计算 机 的 可 靠 性 一 般 采 取 如 下 两 项 措施 。 

(1) 提高 元 器 件 质量 ， 改 进 加 工 工艺 与 工艺 结构 ， 完 善 电路 设计 。 

(2) 发 展 容错 技术 ， 使 得 在 计算 机 硬件 有 故障 的 情况 下 ， 计 算 机 仍 能 继续 运行 ， 得 出 正确 
的 结果 


1.3.4 ”计算 机 系统 的 性 能 评价 


无 论 是 生产 计算 机 的 厂商 还 是 使 用 计算 机 的 用 户 ， 都 需要 有 某 种 方法 来 衡量 计算 机 的 性 能 
来 作为 设计 、 生 产 、 购 买 和 使 用 的 依据 。 但 是 ， 由 于 计算 机 系统 是 一 个 极 复杂 的 系统 ， 其 体系 
结构 、 组 成 和 实现 都 有 若干 种 策略 ， 而 且 其 应 用 领域 也 千差万别 ， 所 以 很 难 找到 统一 的 规则 或 
标准 去 评测 所 有 的 计算 机 。 


1. 性 能 评测 的 常用 方法 


(1) 时 钟 频率 。 计 算 机 的 时 钟 频率 在 一 定 程度 上 反映 了 机 器 速度 ， 一 般 来 讲 ， 主 频 越 高 ， 
速度 越 快 。 但 是 ， 相 同 频率 、 不 同体 系 结构 的 机 器 ， 其 速度 可 能 会 相差 很 多 倍 ， 因 此 还 需要 用 
其 他 方法 来 测定 机 器 性 能 。 

(2) 指令 执行 速度 。 在 计算 机 发 展 的 初期 , 曾 用 加 法 指令 的 运算 速度 来 衡量 计算 机 的 速度 ， 
速度 是 计算 机 的 主要 性 能 指标 之 一 。 因 为 加 法 指令 的 运算 速度 大 体 上 可 反映 出 乘法 、 除 法 等 其 
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他 算术 运算 的 速度 ， 而 且 罗 辑 运算 、 转 移 指令 等 简单 指令 的 执行 时 间 往 往 设 计 成 与 加 法 指令 相 
同 ， 因 此 加 法 指令 的 运算 速度 有 一 定 代表 性 。 当 时 表征 机 器 运算 速度 的 单位 是 KIPS (每 秒 干 条 
指令 )》， 后 来 随 着 机 器 运算 速度 的 提高 ， 计 量 单位 由 KIPS 发 展 到 MIPS (每 秒 百 万 条 指令 ) 。 

(3) 等 效 指令 速度 法 。 随 着 计算 机 指令 系统 的 发 展 ， 指 令 的 种 类 大 大 增加 ， 用 单 种 指令 的 
MIPS 值 来 表征 机 器 的 运算 速度 的 局 限 性 日 益 暴露 ， 因 此 很 快 就 出 现 了 改进 的 办 法 ， 称 之 为 吉 
普 森 〈Gibson) 混合 法 或 等 效 指令 速度 法 。 

等 效 指令 速度 法 统计 各 类 指令 在 程序 中 所 占 比例 ， 并 进行 折算 。 设 某 类 指令 i 在 程序 中 所 
占 比 例 为 w;， 执 行 时 间 为 #， 则 等 效 指令 的 执行 时 间 为 


rn x0 


i=1 


其 中 为 指令 的 种 类 数 。 
(4) 数据 处 理 速 率 〈(Processing Data Rate，PDR) 法 。 因 为 在 不 同 程序 中 ， 各 类 指令 的 使 
用 频率 是 不 同 的 ， 所 以 固定 比例 方法 存在 着 很 大 的 局 限 性 ， 而 且 数据 长 度 与 指令 功能 的 强 弱 对 
解 题 的 速度 影响 极 大 。 同 时 ， 这 种 方法 也 不 能 反映 现代 计算 机 中 高 速 缓冲 存储 器 〈Cache) 、 
流水 线 和 交叉 存储 等 结构 的 影响 。 具 有 这 种 结构 的 计算 机 的 性 能 不 仅 与 指令 的 执行 频率 有 关 ， 
而 且 也 与 指令 的 执行 顺序 与 地 址 分 布 有 关 。 
采用 计算 PDR 值 的 方法 来 衡量 机 器 性 能 时 ，PDR 值 越 大 ， 机 器 性 能 越 好 。PDR 与 每 条 指 
令 和 每 个 操作 数 的 平均 位 数 以 及 每 条 指令 的 平均 运算 速度 有 关 ， 其 计算 方法 如 下 : 
PDR=L/R 
其 中 ，L=0.85G+0.15H +0.4J +0.15K ，R=0.85M +0.09N+0.06P 。 
式 中 : G 一 一 每 条 定点 指令 的 位 数 ; 
M 一 一 平均 定点 加 法 时 间 ; 
有 一 一 每 条 浮 点 指令 的 位 数 ; 
N 平均 浮 点 加 法 时 间 ; 
J 一 一 定点 操作 数 的 位 数 ; 
Pp 平均 浮 点 乘法 时 间 ; 
KK 一 一 浮 点 操作 数 的 位 数 。 
此 外 ， 还 作 了 如 下 规定 ，G >20 位 ， 厂 >30 位 ， 从 主 存 取 一 条 指令 的 时 间 等 于 取 一 个 字 
的 时 间 ; 指令 与 操作 数 存放 在 主 存 ， 无 变 址 或 间 址 操作 ;允许 有 并 行 或 先行 取 指令 功能 ， 此 时 
选择 平均 取 指 令 时 间 。PDR 值 主要 对 CPU 和 主 存储 器 的 速度 进行 度量 ， 但 不 适合 衡量 机 器 的 
整体 速度 ， 因 为 它 没有 涉及 Cache、 多 功能 部 件 等 技术 对 性 能 的 影响 。 
(5) 核心 程序 法 。 上 述 性 能 评价 方法 主要 是 针对 CPU (有 时 包括 主 存 ) ， 它 没有 考虑 诸如 
IO 结构 、 操 作 系统 、 编 译 程序 的 效率 等 系统 性 能 的 影响 ， 因 此 难以 准确 评价 计算 机 的 实际 工 
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作 能 力 。 

核心 程序 法 是 研究 较 多 的 一 种 方法 ， 它 把 应 用 程序 中 用 得 最 频繁 的 那 部 分 核心 程序 作为 评 
价 计 算 机 性 能 的 标准 程序 ， 在 不 同 的 机 器 上 运行 ， 测 得 其 执行 时 间 ， 作 为 各 类 机 器 性 能 评价 的 
依据 。 机 器 软 硬 件 结构 的 特点 能 在 核心 程序 中 得 到 反映 , 但 是 核心 程序 各 部 分 之 间 的 联系 较 小 。 
由 于 程序 短 ， 所 以 访问 存储 器 的 局 部 性 特征 很 明显 ， 以 致 Cache 的 命中 率 比 一 般 程 序 高 。 


2. 基准 测试 程序 


基准 程序 法 (Benchmark〉 是 测试 性 能 的 较 好 方法 ， 有 多 种 多 样 的 基准 程序 ， 如 主要 测试 
整数 性 能 的 基准 程序 、 测 试 浮 点 性 能 的 基准 程序 等 。 

(1) 整数 测试 程序 。Dhrystone 是 一 个 综合 性 的 基准 测试 程序 , 它 是 为 了 测试 编译 器 及 CPU 
处 理 整 数 指令 和 控制 功能 的 有 效 性 ， 人 为 地 选择 一 些 “ 典 型 指令 ”综合 起 来 形成 的 测试 
程序 。 

Dhrystone 程序 测试 的 结果 由 每 秒 多 少 个 Dhrystones 来 表示 机 器 的 性 能 ， 这 个 数值 越 大 ， 
性 能 越 好 。VAX11/780 的 测试 结果 为 1757Dhrystones 每 秒 , 为 便于 比较 ， 人 们 假设 1VAX MIPS 
三 1757Dhrystones 每 秒 ,将 被 测 机 器 的 结果 除 以 1757, 就 得 到 被 测 机 器 相对 VAX11/780 的 MIPS 
值 。 有 些 厂家 在 宣布 机 器 性 能 时 就 用 Dhrystone MIPS 值 作为 各 自 机 器 的 MIPS 值 。 

不 过 不 同 的 厂家 在 测试 MIPS 值 时 ， 使 用 的 基准 程序 一 般 是 不 同 的 ， 因 此 不 同 厂家 机 器 的 
MIPS 值 有 时 虽然 是 相同 的 ， 但 其 性 能 却 可 能 差别 很 大 ， 那 是 因为 各 厂家 在 设计 计算 机 时 针对 
不 同 的 应 用 领域 (如 科学 和 工程 、 商 业 管 理 、 图 形 处 理 等 ) 而 采用 了 不 同 的 体系 结构 和 实现 方 
法 。 同 一 厂家 的 机 器 ， 采 用 相同 的 体系 结构 ， 用 相同 的 基准 程序 测试 ， 得 到 的 MIPS 值 越 大 ， 
一 般 说 明 机 器 速度 越 快 。 

(2) 浮 点 测试 程序 。 在 计算 机 科学 和 工程 应 用 领域 内 ， 浮 点 计算 工作 量 占 很 大 比例 ， 因 此 
机 器 的 浮 点 运算 性 能 对 系统 的 应 用 有 很 大 的 影响 。 有 些 机 器 只 标 出 单个 浮 点 操作 性 能 ， 如 浮 点 
加 法 、 浮 点 乘法 时 间 ， 而 大 部 分 工作 站 则 标 出 用 Linpack 和 Whetstone 基准 程序 测 得 的 浮 点 性 
能 。Linpack 主要 测试 向 量 性 能 和 高 速 缓存 性 能 。Whetstone 是 一 个 综合 性 测试 程序 ， 除 测试 浮 
点 操作 外 ， 还 测试 整数 计算 和 功能 调用 等 性 能 。 

@ 理论 峰值 浮 点 速度 。 巨 型 机 和 小 巨型 机 在 说 明 书 中 经 常 给 出 “理论 峰值 速度 ”的 
MFLOPS 值 ， 它 不 是 机 器 实际 执行 程序 时 的 速度 ， 而 是 机 器 在 理论 上 最 大 能 完成 的 浮 点 处 理 速 
度 。 它 不 仅 与 处 理 机 时 钟 周期 有 关 ， 而 且 还 与 一 个 处 理 机 里 能 并 行 执行 操作 的 流水 线 功能 部 件 
数目 和 处 理 机 的 数目 有 关 。 多 个 CPU 机 器 的 峰值 速度 是 单个 CPU 的 峰值 速度 与 CPU 个 数 的 
乘积 。 
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@ Linpack 基准 测试 程序 。Linpack 基准 程序 是 一 个 用 FORTRAN 语言 编写 的 子 程序 软件 
包 ， 称 为 基本 线性 代数 子 程序 包 ， 此 程序 完成 的 主要 操作 是 浮 点 加 法 和 浮 点 乘法 操作 。 测 量 计 
算 机 系统 的 Linpack 性 能 时 ， 让 机 器 运行 Linpack 程序 ， 测 量 运行 时 间 ， 将 结果 用 MFLOPS 
表示 。 

当 解 n 阶 线性 代数 方程 组 时 ，n 越 大 ， 向 量化 程度 越 高 。 其 关系 如 表 1-8 所 示 。 


表 1-8 矩阵 的 向 量化 程度 


矩阵 规模 100X100 300X300 1000X 1000 
向 量化 百分比 80% 95% 98% 


向 量化 百分比 指 的 是 含 向 量 成 分 的 计算 量 占 整 个 程序 计算 量 的 百分比 。 在 同一 台 机 器 中 ， 
向 量化 程度 越 高 ， 机 器 的 运算 速度 越 快 ， 因 为 不 管 的 大 小 ， 求 解 方程 时 花 在 非 向 量 操 作 的 时 
间 差不多 是 相等 的 。 

@ Whetstone 基准 测试 程序 。Whetstone 是 用 FORTRAN 语言 编写 的 综合 性 测试 程序 ， 主 
要 由 执行 浮 点 运算 、 整 数 算术 运算 、 功 能 调用 、 数 组 变 址 、 条 件 转移 和 超越 函数 的 程序 组 成 。 
Whetstone 的 测试 结果 用 Kwips 表示 ，1Kwips 表示 机 器 每 秒 钟 能 执行 1000 条 Whetstone 指令 。 
(3) SPEC 基准 程序 (SPEC Benchmark) 。SPEC (System Performance Evaluation Cooperation ) 
是 由 几 十 家 世界 知名 的 计算 机 大 厂商 所 支持 的 非 盘 利 的 合作 组 织 ， 旨 在 开发 共同 认可 的 标准 基 
准 程 序 。 
机 


SPEC 基准 程序 是 由 SPEC 开发 的 一 组 用 于 计算 机 性 能 综合 评价 的 程序 。 以 对 VAX11/780 
的 测试 结果 作为 基数 ， 其 他 计算 机 的 测试 结果 以 相对 于 这 个 基数 的 比率 来 表示 。SPEC 基准 
程序 能 较 全 面 地 反映 机 器 性 能 ， 有 很 高 的 参考 价值 。 

SPEC 1.0 是 1989 年 10 月 宣布 的 , 是 一 套 复杂 的 基准 程序 集 ， 主 要 用 于 测量 与 工程 和 科学 
应 用 有 关 的 数字 密集 型 的 整数 和 浮 点 数 方面 的 计算 。 源 程序 超过 15 万 行 , 包含 10 个 测试 程序 ， 
使 用 的 数据 量 比较 大 ， 分 别 测试 应 用 的 各 个 方面 。 

SPEC 基准 程序 测试 结果 一 般 以 SPECmark (SPEC 分 数 )、SPECint (SPEC 整数 ) 和 SPECfp 
(SPEC 浮 点 数 ) 来 表示 。 其 中 ，SPEC 分 数 是 10 个 程序 的 几何 平均 值 ，SPEC 整数 是 4 个 整数 
程序 的 几何 平均 值 ，SPEC 浮 点 数 是 6 个 浮 点 程序 的 几何 平均 值 。 

1992 年 ， 在 原来 SPECint89 和 SPECfp89 的 基础 上 又 增加 了 两 个 整数 测试 程序 和 8 个 浮 点 
数 测试 程序 ， 因 此 SPECint92 由 6 个 程序 组 成 ,SPECfp92 由 14 个 程序 组 成 。 这 20 个 基准 程序 
是 基于 不 同 的 应 用 写成 的 ， 主 要 测 32 位 CPU、 主 存储 器 、 编 译 器 和 操作 系统 的 性 能 。 

SPEC 基准 程序 的 测试 结果 获得 了 普遍 的 认可 。 
(4) TPC 基准 程序 。TPC (Transaction Processing Council， 事 务 处 理 委 员 会) 基准 程序 是 
TPC 开发 的 评价 计算 机 事务 处 理性 能 的 测试 程序 ,用 以 评测 计算 机 在 事务 处 理 、 数 据 库 处 理 、 
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企业 管理 与 决策 支持 系统 等 方面 的 性 能 ,TPC 已 经 推出 了 4 套 基准 程序 : TPC-A、TPC-B、TPC-C 
和 TPC-D。 其 中 A 和 B 已 经 过 时 ， 不 再 使 用 。TPC-C 是 在 线 事务 处 理 〈On-line Transaction 
Processing，OLTP) 的 基准 程序 ，TPC-D 是 决策 支持 的 基准 程序 。TPC 即将 推出 TPC-E， 作 为 
大 型 企业 信息 服务 的 基准 程序 。 该 基准 程序 的 评测 结果 用 每 秒 完成 的 事务 处 理 数 TPC 来 表示 。 
TPC 基准 测试 程序 在 商业 界 范围 内 建立 了 用 于 衡量 机 器 性 能 以 及 性 能 价格 比 的 标准 。 但 是 ， 任 
何 一 种 测试 程序 都 有 一 定 的 适用 范围 ，TPC 也 不 例外 。 


1.4 多 媒体 基础 知识 


媒体 (Media) 通常 包括 两 方面 的 含义 : 一 是 指 信息 的 物理 载体 〈 即 存储 和 传递 信息 的 实 
体 ) ， 如 手册 、 磁 盘 、 光 盘 、 磁 带 以 及 相关 的 播放 设备 等 ， 二 是 指 承载 信息 的 载体 ， 即 信息 的 
表现 形式 (或 者 说 传播 形式 ), 如 文字 、 声音 、 图 像 、 动 画 和 视频 等 , 也 就 是 CCITT (Consultative 
Committee on International Telephone and Telegraph， 国 际 电 话 电报 咨询 委员 会 ) 定义 的 存储 媒体 
和 表示 媒体 。 

按照 CCITT 的 定义 ， 媒 体 可 以 归 类 如 下 。 

(1) 感觉 媒体 (Perception Medium) 。 指 直接 作用 于 人 的 感觉 器 官 ， 使 人 产生 直接 感觉 的 
媒体 。 如 引起 听觉 反应 的 声音 、 引 起 视觉 反应 的 图 像 等 。 

(2) 表示 媒体 (Representation Medium) 。 指 传输 感觉 媒体 的 中 介 媒 体 ， 即 用 于 数据 交换 
的 编码 。 如 图 像 编码 (JPEG、MPEG) 、 文 本 编码 〈ASCII、GB2312) 和 声音 编码 等 。 

(3) 表现 媒体 (Presentation Medium) 。 指 进行 信息 输入 和 输出 的 媒体 。 例 如 ， 键 盘 、 鼠 
标 、 扫 描 仪 、 话 简 和 摄像 机 等 为 输入 媒体 ， 显 示 器 、 打 印 机 和 喇叭 等 为 输出 媒体 。 

(4) 交换 媒体 (Interchange Medium) 。 指 用 来 在 系统 之 间 进 行 数据 交换 的 媒体 ， 包 括 下 面 
两 种 媒体 。 

@ 存储 媒体 (Storage Medium) 。 指 用 于 存储 表示 媒体 的 物理 介质 ， 如 硬盘 、 软 盘 、 磁 盘 、 
光盘 、ROM 及 RAM 等 。 

@ 传输 媒体 (Transmission Medium) 。 指 传输 表示 媒体 的 物理 介质 ， 如 电缆、 光缆 和 电 

为 了 使 不 同 的 媒体 能 够 有 机 地 连接 起 来 ， 往 往 按照 实际 需要 建立 一 种 连接 机 制 或 结构 ， 把 
这 种 链接 机 制 或 结构 称 为 超 媒体 (Hyper Media) 。 超 媒体 是 一 个 信息 存储 和 检索 系统 ， 它 把 文 
字 、 图 形 、 图 像 、 动 画 、 声 音 和 视频 等 媒体 集成 为 一 个 相关 的 基本 信息 系统 。 因 特 网 的 WWW 
应 用 是 超 媒体 技术 的 最 常见 例子 。 

多 媒体 技术 就 是 指 利用 计算 机 技术 把 文本 、 图 形 、 图 像 、 声 音 、 动 画 和 电视 等 多 种 媒体 综 
合 起 来 ， 使 多 种 信息 建立 逻辑 连接 ， 并 能 对 它们 进行 获取 、 压 缩 、 加 工 处 理 、 存 储 ， 集 成 为 一 
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个 具有 交互 性 的 系统 。 多 媒体 技术 的 内 涵 和 范围 极其 广泛 ， 所 涉及 的 技术 也 极为 广泛 。 
1.4.1 多 媒体 计算 机 系统 


通常 将 具有 对 多 种 媒体 进行 处 理 能 力 的 计算 机 称 为 多 媒体 计算 机 (Multimedia Personal 
Computer，MPC) 。 随 着 芯片 设计 技术 的 发 展 ， 已 将 多 媒体 和 通信 功能 集成 到 了 处 理 器 的 芯片 
中 ， 形 成 了 专用 的 多 媒体 微 处 理 器 ， 使 得 处 理 音频 和 视频 如 处 理 数字 和 文字 一 样 快捷 。 为 了 加 
快 多 媒体 信息 处 理 的 速度 ， 可 以 为 通用 CPU 添加 特殊 的 多 媒体 处 理 指令 (如 之 前 Intel 公司 处 
理 器 的 MMX 扩展 指令 ) ， 也 可 以 设计 专用 的 协 处 理 器 (如 GPU) 来 处 理 。 另 一 方面 ， 通 过 系 
统 总 线 扩展 ， 可 以 接 入 各 类 板 卡 ， 集 成 以 PC 为 中 心 的 组 合 平台 。 目 前 与 多 媒体 信息 处 理 相关 
的 常见 板 卡 有 音频 卡 、 视 频 采 集 卡 、 图 形 图 像 加 速 卡 等 ， 相 关 的 外 部 设备 有 各 类 光盘 驱动 器 、 
扫描 仪 、 摄 像 头 、 数 码 相机 等 。 另 外 ， 一 个 完整 的 多 媒体 计算 机 系统 还 应 包括 各 类 多 媒体 信息 
处 理 软件 。 


1. 多 媒体 硬件 系统 


多 媒体 硬件 系统 可 以 看 成 是 在 PC 的 基础 上 进行 了 硬件 扩充 ， 以 适应 多 媒体 信息 处 理 功能 
的 需求 。 计 算 机 硬件 及 声 像 等 媒体 输入 /输出 设备 构成 了 多 媒体 硬件 平台 。 

常见 的 多 媒体 硬件 子 系统 如 下 。 

(1) 音频 卡 〈Sound Card) 。 音 频 卡 (声卡 ) 用 于 处 理 音频 信息 ， 它 可 以 把 话 简 、 录 音 机 
和 电子 乐器 等 输入 的 声音 信息 进行 模 / 数 转换 (A/D〉、 压 缩 等 处 理 ， 也 可 以 把 经 过 计算 机 处 理 
的 数字 化 的 声音 信号 通过 还 原 〈 解 压缩 )、 数 / 模 转换 (DA) 后 用 音箱 播放 出 来 ， 或 者 用 录音 
设备 记录 下 来 。 音 频 卡 的 关键 技术 包括 数字 音频 、 音 乐 合 成 、MIDI 和 音效 。 数 字音 频 部 分 具有 
录音 和 播放 声音 信号 的 功能 。 

(2) 视频 采集 卡 。 视 频 采 集 卡 用 来 支持 视频 信号 的 输入 与 输出 。 它 可 以 采集 视频 源 、 声 频 
源 的 信息 ， 还 可 以 对 这 些 画面 进行 捕捉 、 数 字 化 、 冻 结 、 存 储 、 压 缩 和 输出 等 操作 ， 并 可 以 通 
过 硬件 支持 对 画面 进行 修整 、 对 像素 显示 进行 调整 、 实 现 缩放 功能 等 。 

(3) 光盘 驱动 器 。 光 盘 驱 动 器 分 为 只 读 光 盘 驱 动 器 〈 如 CD-ROM、DVD-ROM) 和 可 读 写 
光盘 驱动 器 (各 类 光盘 刻录 机 ) 。 只 读 型 光盘 (CD-ROM) 用 于 存储 大 量 的 影像 、 声 音 、 动 画 、 
程序 数据 和 高 分 辨 率 图 像 信 息 。CD-ROM 一 般 提供 650MB 的 存储 容量 ，DVD-ROM 的 存储 容 
量 更 大 ， 从 单 层 单 面 的 4.7GB 到 双 层 双 面 的 17GB 不 等 。 

(4) 图 像 扫 描 仪 。 图 像 扫 描 仪 用 于 把 摄影 作品 、 绘 画作 品 或 其 他 印刷 材料 上 的 文字 和 图 像 
等 平面 图 像 信息 扫描 输入 到 计算 机 中 ， 进 而 对 这 些 图 像 信息 进行 加 工 处 理 、 存 储 和 输出 。 使 用 
扫描 仪 是 获取 图 像 的 一 种 较 简 单 的 方法 。 常 用 的 扫描 仪 类 型 有 手持 式 、 滚 简 式 和 平板 式 等 。 
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(5) 触摸 屏 。 触 摸 屏 是 一 种 随 多 媒体 技术 发 展 而 使 用 的 输入 设备 。 当 手指 点 在 屏幕 上 的 菜 
单 、 图 符 等 图 形 /图 像 按 钮 时 会 产生 触摸 信号 ,该 信号 经 过 变换 后 成 为 计算 机 可 以 处 理 操作 的 命 
令 ， 从 而 实现 人 机 交互 。 
(6) 数字 化 仪 。 数 字 化 仪 是 一 种 图 形 输 入 设备 ， 它 由 平板 加 上 连接 的 手动 定位 装置 组 成 ， 
主要 用 于 输入 地 图 、 气 象 图 等 线 型 图 ， 可 以 通过 手动 定位 笔 方便 地 获得 每 个 线段 的 起 始 坐 标 ， 
从 而 实现 矢量 图 输入 。 

(7) 操纵 杆 。 操 纵 杆 是 一 种 提供 方向 信息 的 输入 设备 ， 一 般 可 以 提供 移动 方向 信息 ， 甚 至 
附加 移动 速度 信息 。 在 多 媒体 计算 机 上 ， 操 纵 杆 常用 作 游 戏 控制 器 ， 用 来 操纵 电子 游戏 。 操 纵 
杆 还 可 以 用 于 各 类 遥控 设备 的 移动 操作 控制 。 它 可 以 以 模拟 信号 方式 工作 ， 也 可 以 以 数字 信和 号 
方式 工作 ， 并 可 兼容 各 种 游戏 模式 。 


2. 多 媒体 软件 系统 


多 媒体 计算 机 软件 系统 主要 包括 多 媒体 操作 系统 、 多 媒体 创作 工具 软件 、 多 媒体 素材 编辑 
软件 和 多 媒体 应 用 软件 。 

(1) 多 媒体 操作 系统 

多 媒体 操作 系统 能 够 对 各 种 多 媒体 设备 进行 控制 和 管理 ， 支 持 对 声音 、 图 像 及 其 他 多 媒体 
信息 的 输入 、 输 出 、 控 制 和 实时 处 理 ， 当 前 主流 的 操作 系统 都 具备 多 媒体 功能 。 

(2) 多 媒体 创作 工具 软件 

多 媒体 创作 工具 软件 是 一 种 应 用 软件 ， 它 提供 了 建立 多 媒体 节目 的 构件 和 框架 的 功能 ， 可 
以 实现 媒体 的 组 接 和 交互 跳 转 功能 。 通 常 ， 多 媒体 创作 工具 软件 帮助 应 用 开发 人 员 提 高 开发 多 
媒体 应 用 程序 的 工作 效率 。 它 们 大 体 上 都 是 一 些 应 用 程序 生成 器 ， 将 各 种 媒体 素材 按照 超 文本 
节点 和 链 结构 的 形式 进行 组 织 ， 形 成 多 媒体 应 用 系统 。 

Authorware、Director、Multimedia Tool Book 等 都 是 比较 有 名 的 多 媒体 创作 工具 。 

(3) 多 媒体 素材 编辑 软件 

在 多 媒体 应 用 中 ， 很 重要 的 一 个 环节 是 制作 所 需要 的 各 种 媒体 素材 。 多 媒体 素材 编辑 软件 
用 于 采集 、 整 理 和 编辑 各 种 媒体 数据 。 多 媒体 编辑 软件 主要 包括 进行 文字 处 理 〈 编 辑 、 排 版 和 
识别 等 ) 的 文本 工具 、 图 形 /图 像 工 具 (如 Photoshop、lllustrator、PhotoDeluxe、PageMaker、 
CorelDRAW 和 AutoCAD 等 ) 、 动 画工 具 (如 GIF Construction Set、Xara3D 及 3ds Max 等 ) 、 
视频 工具 (如 Media Studio、Premiere 等 ) 、 音 频 工具 (如 Audition、GoldWave 和 SONAR 等 ) 、 
播放 工具 (如 Media Player) 。 

(4) 多 媒体 应 用 软件 

多 媒体 应 用 软件 直接 与 用 户 接口 ， 用 户 只 要 根据 应 用 软件 所 给 出 的 操作 命令 ,通过 最 简单 
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的 操作 便 可 使 用 这 些 软件 ， 使 最 终 用 户 运 用 多 媒体 系统 能 够 方便 、 易 学 、 好 用 。 例 如 ， 特 定 的 
专业 信息 管理 系统 ; 语音 /Fax/ 数 据 传输 调制 管理 应 用 系统 ; 多 媒体 监控 系统 ; CD-ROM 光盘 的 
播放 软件 ; 各 种 多 媒体 CAI 软件 ; 各 种 游戏 软件 等 。 还 有 面向 某 一 个 领域 用 户 的 应 用 软件 系统 ， 
例如 多 媒体 会 议 系 统 、 点 播 电视 服务 (VOD) 医用 、 家 用 、 军 用 和 工业 应 用 等 。 


1.4.2 ”声音 


声音 是 通过 空气 传播 的 一 种 连续 的 波 ， 称 为 声波 。 声 波 在 时 间 和 幅度 上 都 是 连续 的 模拟 信 
号 ， 通 常 称 为 模拟 声音 《音频 ) 信号 。 

声音 信号 的 两 个 基本 参数 是 幅度 和 频率 。 幅 度 是 指 声波 的 振幅 ， 通 常用 声 压 级 表示 ， 计 量 
单位 是 分 贝 《dB) 。 频 率 是 指 声波 每 秒 钟 变 化 的 次 数 ， 用 Hz 表示 。 自 然 界 中 的 声音 信号 通常 
是 由 许多 频率 不 同 的 信号 组 成 的 ， 人 耳 能 听 到 的 声音 信号 的 频率 范围 是 20Hz 一 20kHz， 该 频率 
范围 内 的 信号 称 为 音频 〈audio) 信号。 人 们 把 频率 小 于 20Hz 的 声波 信号 称 为 亚 音信 号 (也 称 
次 声波 ) ， 高 于 20kHz 的 信号 称 为 超 音频 信号 〈 也 称 超声 波 ) 。 根 据 声音 所 包含 的 频率 成 分 的 
构成 特征 可 以 将 其 分 成 乐音 和 噪音 两 种 信号 。 如 果 一 个 物体 振动 所 发 出 的 声音 具有 清晰 可 辩 的 
音 高 ， 这 个 显著 的 频率 我 们 称 之 为 基 音 频率 ， 其 他 频率 成 分 称 为 泛音 ， 如 果 所 有 的 泛音 频率 都 
是 基 音 频率 的 整数 倍 ， 这 个 复合 音 我 们 称 之 为 乐音 ， 如 钢琴 、 小 提琴 等 发 出 的 都 是 乐音 ， 如 果 
包含 非 整数 倍 基 音 频率 的 泛音 ， 这 个 音 就 不 具备 清晰 可 辩 的 音 高 ， 这 种 声音 我 们 称 之 为 噪音 。 


1， 声 音信 号 的 数字 化 


声音 信号 是 一 种 模拟 信号 ， 计 算 机 要 对 它 进行 处 理 ， 必 须 将 它 转换 成 为 数字 声音 信号 ， 即 
用 二 进 制 数 字 的 编码 形式 来 表示 声音 。 声 音信 号 数字 化 分 成 以 下 3 个 步骤 。 

(1) 采样 。 采 样 是 把 时 间 连 续 的 模拟 信号 在 时 间 轴 上 离散 化 的 过 程 。 在 某 些 特定 的 时 刻 获 
取 声 音信 号 幅 值 称 为 采样 ， 由 这 些 特定 时 刻 采样 得 到 的 信号 称 为 离散 时 间 信 和 号。 一般 是 每 隔 相 
等 的 一 小 段 时 间 采 样 一 次 ， 其 时 间 间 隔 称 为 采样 周期 ， 其 倒数 称 为 采样 频率 。 根 据 采 样 定理 
为 了 不 产生 失真 ， 采 样 频 率 需 要 大 于 声音 信号 最 高 频率 的 两 倍 。 

(2) 量化 。 量 化 处 理 是 把 在 幅度 上 连续 取 值 (模拟 量 ) 的 每 一 个 样本 转换 为 离散 值 (数字 
量 ) 表示 。 量 化 后 的 样本 是 用 二 进 制 数 来 表示 的 ， 二 进 制 数位 数 的 多 少 反映 了 度量 声音 波形 幅 
度 的 精度 ， 称 为 量化 精度 ， 也 称 为 量化 分 辨 率 。 例 如 ， 每 个 声音 样本 若 用 16 位 〈 两 个 字 节 ) 
表示 ， 则 声音 样本 的 取 值 范围 是 0 一 65535， 精 度 是 1/65536; 若 只 用 8 位 一 个 字 节 ) 表示 ， 
则 样本 的 取 值 范围 是 0 一 255， 精 度 是 1/256。 量 化 精度 越 高 ， 声 音 的 重 构 质量 越 好 ， 需 要 的 存 
储 空间 就 越 多 ， 量 化 精度 越 低 ， 声 音 的 重 构 质量 越 差 ， 需 要 的 存储 空间 越 少 。 

(3) 编码 。 为 了 便于 计算 机 存储 、 处 理 和 传输 , 还 必须 按照 一 定 的 格式 要 求 进行 数 据 编码 ， 
再 按照 某 种 规定 的 格式 将 数据 组 织 成 为 文件 ， 还 可 以 选择 某 一 种 或 者 几 种 方法 对 它 进行 数据 压 
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缩编 码 ， 以 减少 数据 量 。 
经 过 数字 化 处 理 之 后 的 数字 声音 的 主要 参数 如 表 1-9 所 示 。 


表 1-9 数字 化 处 理 之 后 的 数字 声音 的 主要 参数 

说 阴 

表示 每 秒 钟 内 采样 的 次 数 。 采 样 的 3 个 标准 频率 分 别 为 44.1kKHz、22.05 kHz 和 11.05 kHz 
反映 度量 声音 波形 幅度 的 精度 。 声 音信 号 的 量化 精度 一 般 为 8 位 、12 位 或 16 位 

单 声 道 一 次 产生 一 组 声音 波形 数据 ， 双 声 道 则 一 次 同时 产生 两 组 声音 波形 数据 

表示 每 秒 钟 的 数据 量 ， 一 般 以 bps 为 单位 

单位 时 间 内 的 未 压缩 音频 数据 量 与 压缩 后 的 数据 量 之 比 


参数 
量化 位 数 
声 道 数目 


2. 波形 声音 信息 


波形 声音 信息 是 对 声音 信号 波形 直接 采样 的 数据 。 未 经 压缩 的 数字 音频 数据 的 传输 率 可 按 
下 式 计算 : 


数据 传输 率 〈bps) = 采样 频率 (Hz) X 量 化 位 数 (bit) X 声 道 数 
声音 波形 经 过 数字 化 后 所 需 占用 的 存储 空间 可 用 以 下 公式 计算 : 
声音 信号 数据 量 (Byte) = 数据 传输 率 〈bps) X 持 续 时 间 (s) /8 
【 例 1.8】 对 语音 信号 数字 化 采样 ， 采 样 频率 为 8&kHz， 量 化 精度 为 8 位 ， 单 声 道 输出 ， 计 
算 每 秒 钟 及 每 小 时 的 数据 量 。 
解 : 根据 上 述 公 式 每 秒 钟 的 数据 量 为 
采样 频率 X 量 化 位 数 X 声 道 数 X 时 间 /8 = 8kHzX 8bX1X1s/8=8000b=7.8125kB 
1 小 时 数字 语音 的 数据 量 大 约 是 27.466MB。 
【 例 1.9】 CD 唱片 上 所 存储 的 立体 声 高 保 真 数字 音乐 的 采样 频率 为 44.1kHz， 量 化 精度 为 
16 位 ， 双 声 道 ， 计 算 1 小 时 的 数据 量 。 
解 : 44.1kHzX16bX2X3600s = 5080320000b = 63504000B 一 605.6MB 
声音 波形 的 数据 量 非常 大 ， 因 此 在 编码 的 时 候 常常 进行 压缩 以 减少 存储 空间 和 提高 传输 效 
率 ( 降 低 传输 带宽 ) 。 根 据 统计 分 析 结 果 ， 语 音信 号 中 包含 有 大 量 的 匈 余 信息 ， 再 加 上 还 可 以 
利用 人 的 听觉 感知 特性 ， 因 此 产生 了 许多 能 满足 实际 应 用 需求 的 压缩 算法 。 一 个 好 的 数据 压缩 
算法 通常 应 该 满足 下 列 需 求 。 
(1) 压缩 倍数 高 ， 压 缩 后 的 数据 率 低 。 
(2) 解码 后 的 信号 失真 小 、 质 量 高 
(3) 算法 简单 ， 执 行 速度 快 ， 延 迟 时 间 短 。 
(4) 编码 器 /解码 器 的 成 本 低 。 
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波形 编码 技术 就 是 直接 对 波形 采样 数据 进行 压缩 处 理 的 方法 ， 例 如 差分 脉冲 编码 调制 
(DPCM) 、 自 适应 差分 脉冲 编码 调制 (ADPCM) 和 子 带 编码 (SBC) 等 。 波 形 编码 的 特点 是 
通用 性 强 ， 对 所 有 使 用 波形 表示 的 数字 声音 都 有 效 ， 可 获得 较 高 的 声音 重 构 质量 ， 但 很 难 获得 
高 压缩 比 。 基 于 波形 的 压缩 编码 方法 虽然 压缩 比 不 高 ， 但 能 以 较 高 质量 重 构 声音 信号 ， 且 算法 
简单 、 易 实现 ， 便 于 编辑 处 理 ， 在 多 媒体 计算 机 和 多 媒体 文档 中 有 广泛 的 应 用 。 

对 于 语音 信号 这 种 特殊 的 声音 数据 ， 可 以 采用 参数 编码 〈 也 称 为 模型 编码 ) 技术 。 这 是 一 
种 基于 声音 生成 模型 的 压缩 方法 ， 从 语音 波形 信号 中 提取 语音 参数 ， 使 用 这 些 参数 通过 语音 
成 模型 重 构 出 语音 。 例 如 ， 线 性 预测 编码 〈(LPC) 和 各 种 声 码 器 〈Vocoder) 。 它 的 优点 是 能 达 
到 很 高 的 压缩 比 ， 缺 点 是 受 声音 生成 模型 的 限制 ， 重 构 信 号 的 音质 较 差 。 

波形 编码 虽然 可 提供 高 质量 的 语音 ， 但 数据 率 比较 高 ， 很 难 低 于 16Kbps; 参数 编码 的 数 
据 率 虽然 可 降低 到 3kbps 甚至 更 低 ， 但 它 的 音质 根本 不 能 与 波形 编码 相 比 。 混 合 编码 是 对 上 述 
两 种 方法 的 结合 ， 它 既 能 达到 较 高 的 压缩 比 ， 又 能 保证 一 定 的 质量 ， 但 算法 相对 复杂 一 些 。 

ITU-T 的 数字 语音 压缩 编码 有 多 种 国际 标准 ， 例 如 G711、G721、G726、G727、G722、 
G.728 等 。 

感知 声音 编码 〈Perceptual Audio Coding) 是 另 一 种 常用 的 音频 信号 编码 技术 ， 它 不 仅 依据 
波形 本 身 的 相关 性 , 还 利用 人 的 听觉 系统 特性 来 达到 压缩 声音 的 目的 。 在 MPEG 系列 国际 标准 
中 ， 对 作为 视频 图 像 伴音 的 数字 音频 制定 了 MPEG-1 Audio、MPEG-2 Audio、MPEG-2AAC 和 
MPEG-4 Audio 等 多 种 数据 压缩 编码 的 标准 。MPEG 系列 音频 压缩 编码 就 是 典型 的 感知 编码 ， 
数据 压缩 的 主要 依据 是 人 耳 的 听觉 特性 ， 特 别 是 人 耳 存 在 着 随 声 音频 率 变化 的 听觉 域 ， 以 及 人 
耳 的 听觉 掩蔽 特性 ， 依 靠 复杂 的 心理 声学 模型 和 感知 子 带 编 码 技术 能 获得 高 质量 、 高 压缩 比 的 
编码 。 


[a 


SS 


个 人 计算 机 和 多 媒体 系统 中 的 声音 除了 数字 波形 声音 之 外 , 还 有 一 类 是 使 用 符号 参数 表示 
的 ， 如 果 要 将 声音 播放 出 来 ， 则 需要 由 计算 机 合成 出 对 应 的 声音 信号 ， 包 括 语音 合成 和 音乐 
合成 。 

1) 语音 合成 

语音 合成 目前 主要 指 从 文本 到 语音 的 合成 ， 也 称 为 文 语 转换 。 采 用 文 语 转换 的 方法 输出 语 
音 ， 应 预先 建立 语音 参数 数据 库 、 发 音 规则 库 等 。 当 需要 输出 语音 时 ， 系 统 按 需 求 先 合成 语音 
单元 ， 再 按 语音 学 规则 或 语言 学 规则 连接 成 自然 的 语 流 。 文 语 转换 的 参数 数据 库 不 随 发 音 时 间 
的 增长 而 加 大 ， 但 规则 库 却 随 语音 质量 的 要 求 而 增 大 。 语 音 合 成 有 多 方面 的 应 用 ， 例 如 海量 查 
询 与 声讯 服务 、 航 班 动态 查询 、 电 话 报税 、 有 声 E-mail 等 ， 这 些 业 务 都 需要 以 准确 、 清 晰 的 语 
音 通 过 电话 进行 操作 提示 并 提供 查询 结果 。 一 般 来 说 ， 对 合成 的 语音 要 求 能 够 做 到 可 听 懂 、 自 
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然 、 延 迟 时 间 短 、 速 度 可 控制 等 。 

文 语 转换 在 原理 上 一 般 分 成 两 步 ， 第 一 步 先 将 文字 序列 转换 成 音韵 序列 ， 第 二 步 再 由 语音 
合成 器 生成 语音 波形 (如 图 1-20 所 示 ) 。 其 中 ， 第 一 步 涉 及 语言 学 处 理 ， 例 如 分 词 、 字 音 转换 
等 ， 以 及 一 整套 有 效 的 韵律 控制 规则 ， 第 二 步 需要 使 用 语音 合成 技术 ， 能 按 要 求实 时 合成 出 高 
质量 的 语音 流 。 


标 [站 
文本 一 | 文本 分 析 上 二 。 | 的 律 处 理 ~ | 语音 合成 -~ 波形 声音 


词典 、 规则 韵律 规则 库 语 
图 1-20 文 语 转换 过 程 示意 


从 合成 采用 的 技术 来 说 ， 语 音 合成 可 分 为 发 音 参数 合成 、 声 道 模 型 参数 合成 和 波形 编辑 
合成 。 
(1) 发 音 参 数 合成 。 这 种 方法 对 人 的 发 音 过 程 进行 直接 模拟 ， 它 定义 了 展 、 舌 、 声 带 的 相 
关 参 数 ， 如 开口 度 、 舌 高 度 、 舌 位 置 和 声带 张力 等 。 由 这 些 发 音 参数 估计 声 道 截面 积 函数 ， 进 
而 计算 声波 。 但 由 于 人 发 音 的 生理 过 程 复 杂 以 及 理论 计算 与 物理 模拟 之 间 的 差异 ， 合 成 语音 的 
质量 目前 还 不 理想 。 

(2) 声 道 模 型 参数 合成 。 这 种 方法 基于 声 道 截 面积 函数 或 声 道 谐振 特性 合成 语音 ， 如 共振 
峰 合 成 器 、LPC 合成 器 。 这 类 合成 器 的 比特 率 低 、 音 质 适 中 。 为 改善 音质 ， 发 展 了 混合 编码 技 
术 ， 主 要 手段 是 改善 激励 ， 例 如 码 本 激励 、 多 脉冲 激励 和 长 时 预测 规则 码 激励 等 。 这 样 比特 率 
有 所 增 大 ， 同 时 音质 得 到 提高 。 

(3) 波 形 编辑 合成 。 波形 编 辑 合成 技术 是 直接 把 语音 波形 数据 库 中 的 波形 相互 拼接 在 一 起 ， 
输出 连续 的 语 流 。 这 种 语音 合成 技术 用 原始 语音 波形 代替 参数 ， 而 且 这 些 语音 波形 取 自 自然 语 
言 的 词 或 句子， 它 隐 含 了 声调 、 重 音 、 发 音速 度 的 影响 ， 合 成 的 语言 清晰 、 自 然 。 其 质量 普遍 
高 于 参数 合成 。 

2) 音乐 合成 

音乐 是 用 乐谱 进行 描述 而 由 乐器 演奏 而 成 的 。 乐 谱 的 基本 组 成 单元 是 音符 (Notes)， 现 
代 音 乐 体系 中 基本 音阶 由 7 个 音 组 成 ， 常 用 音符 88 个 ， 电 子 乐器 中 可 以 支持 到 128 个 。 

音符 代表 的 是 音乐 ， 其 基本 要 素 有 音调 、 音 色 、 响 度 和 持续 时 间 。 音 调 指 乐音 的 基 频 ， 基 
频 低 ， 声 音 低沉 ; 基 频 高 ， 声 音 高 昂 。 不 同 乐器 有 不 同 的 音色 ， 音 色 是 由 乐音 的 频谱 结构 决定 
的 。 响 度 即 声音 的 强度 ， 音 量 。 一 首 乐曲 中 每 一 个 乐音 的 持续 时 间 是 变化 的 ， 从 而 形成 旋律 。 
音乐 信号 可 以 使 用 电子 学 原理 合成 出 来 〈 生 成 相应 的 波形 )， 从 而 对 各 种 乐器 的 音色 进行 模拟 。 
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数字 音乐 合成 方法 主要 有 以 下 两 类 : 

(1) 数字 调频 (FM) 合成 法 。FM 是 使 高 频 振荡 波 的 频率 按 调 制 信号 规律 变化 的 一 种 调制 
方式 。 在 音乐 合成 器 中 , 数字 载波 波形 和 调制 波形 有 很 多 种 , 采用 不 同 的 调制 波 频率 和 调制 参数 ， 
就 可 以 方便 地 合成 具有 不 同 频谱 分 布 的 波形 ， 再 现 某 些 乐器 的 音色 。 用 户 还 可 以 这 种 方法 得 到 具 
有 独特 效果 的 电子 模拟 声 ， 创 造 出 丰富 多 彩 的 、 并 非 真 实 乐器 的 音色 。 

(2) 波 表 (Wavetable) 合成 法 。 使 用 FM 合成 法 产生 的 乐音 并 不 理想 ， 乐 器 音色 的 真实 感 
较 差 。 目前， 电子 音乐 合成 一 般 采 用 波 表 合成 法 ， 这 种 方法 把 真实 乐器 发 出 的 声音 波形 进行 数 
字 化 采样 ， 然 后 将 它们 放 在 一 个 索引 表 中 ， 合 成 音乐 时 以 查 表 匹 配方 式 获 取 真 实 乐器 的 波形 。 
这 种 以 真实 声音 波形 为 基础 的 音源 音色 真实 、 质 量 好 ， 合 成 的 音乐 效果 接近 真实 乐器 的 音色 。 


4. MIDI 


MIDI (Musical Instrument Digital Interface) 是 指 乐 器 数字 接口 国际 标准 。MIDI 标准 规定 
了 电子 乐器 与 计算 机 之 间 、 电 子 乐器 之 间 硬 件 互 连 及 数据 通信 协议 的 完整 规范 。 由 于 MIDI 标 
准 定义 了 计算 机 音乐 程序 、 合 成 器 及 其 他 电子 设备 交换 信息 和 电子 信号 的 方式 ， 所 以 可 解决 不 
同 电子 乐器 之 间 不 兼容 的 问题 。 

MIDI 设备 是 指 符合 MIDI 规范 的 设备 。 通 过 MIDI 接口 ， 不 同 MIDI 设备 之 间 可 以 进行 信 
息 交 换 。 带 有 MIDI 接口 以 及 专用 的 MIDI 电缆 的 计算 机 、 音 乐 合成 器 和 其 他 MIDI 设备 连接 在 
一 起 ， 即 可 构成 计算 机 音乐 系统 。 数 据 由 MIDI 设备 的 键盘 产生 ， 可 通过 声音 合成 器 还 原 为 声 
音 。 通 过 计算 机 可 以 控制 乐器 的 输出 ， 并 能 接收 、 存 储 和 处 理 经 过 编码 的 音乐 数据 。 

MIDI 文件 是 指 计算 机 中 用 于 存储 和 交换 MIDI 消息 的 一 种 数据 文件 ， 它 由 一 系列 的 MIDI 
消息 组 成 。 它 不 仅 包 含 了 与 音乐 演奏 有 关 的 消息 ， 如 音 高 、 速 度 和 音色 等 ， 还 包含 了 大 量 与 音 
响 有 关 的 控制 信息 ， 如 声 像 、 效 果 和 均衡 等 。 通 用 MIDI 标准 中 定义 了 16 个 通道 ， 每 个 通道 对 
应 不 同 的 乐器 音色 ，MIDI 通道 消息 包括 每 个 通道 的 演奏 音符 信息 ， 如 键 、 音 长 、 音 量 和 力度 
〈 击 键 时 ， 键 达到 最 低位 置 的 速度 ) 等 。 标 准 MIDI 文件 格式 采用 的 文件 扩展 名 为 .mid， 它 是 音 
序 软件 的 文件 交换 标准 ， 也 是 商业 音乐 作品 发 行 的 标准 。 

MIDI 音乐 信息 与 高 保 真 的 波形 声音 信息 相 比 ， 虽 然 音 质 受 限于 具体 使 用 的 音乐 合成 器 ， 
但 它 的 数据 量 少 得 多 ， 又 易于 编辑 修改 ， 还 可 以 与 波形 声音 同时 播放 。 

5， 声 音 文件 格式 

数字 声音 在 计算 机 中 存储 和 处 理 时 ， 其 数据 必须 以 文件 的 形式 进行 组 织 ， 所 选用 的 文件 格 
式 必 须 得 到 操作 系统 和 应 用 软件 的 支持 。 部 分 常见 的 声音 文件 格式 举例 如 下 。 


(1) Wave 文件 (.wav) 。Microsoft Windows 系统 中 使 用 的 标准 音频 文件 格式 ， 它 来 源 于 
对 声音 波形 的 采样 ， 即 波形 文件 。 利 用 该 格式 记录 的 声音 文件 能 够 和 原声 基本 一 致 ， 质 量 非常 


国 60 若 。 歼 据 库 系统 工程 是 教程 (第 3 版 ) 


高 ， 但 文件 数据 量 大 。 

(2) Sound 文件 (.snd) 。NeXT Computer 公司 推出 的 数字 声音 文件 格式 ， 支 持 压缩 。 

(3) Audio 文件 (.au) 。Sun Microsystems 公司 推出 的 广泛 应 用 于 UNIX 系统 的 数字 声音 
文件 格式 。 

(4) AIFF 文件 (.aif) 。Apple 公司 的 Mac OS 中 的 标准 音频 文件 格式 。 

(5) Voice 文件 〈.voc) 。Creative 公司 的 波形 音频 文件 格式 。 

(6) MPEG-1 Audio Layer 3 文件 (.mp3) 。 最 流行 的 声音 文件 格式 ， 在 较 大 压缩 比 之 下 仍 
能 重 构 高 音质 的 声音 信号 。 

(7) RealAudio 文件 (.ra) 。 这 是 RealNetworks 公司 设计 的 声音 压缩 文件 格式 ， 具 有 较 高 
的 压缩 比 ， 是 为 了 解决 网 络 传输 带宽 资源 而 设计 的 。 

(8) MIDI 文件 〈.mid、.rmi) 。 前 文 已 经 有 所 介绍 ，MIDI 文件 是 用 于 存储 和 交换 MIDI 
消息 的 一 种 数字 音乐 文件 ，.rmi 格式 是 Windows 中 对 MIDI 文 件 格式 的 一 个 简单 扩展 格式 。 


1.4.3 ”图形 和 图 像 


计算 机 中 的 “图 ”有 两 种 常用 的 表示 形式 ， 一 种 是 被 称 为 “图 形 ” 〈Graphic) 的 矢量 图 ， 
它 是 由 称 为 矢量 的 数学 对 象 所 定义 的 直线 和 曲线 等 组 成 的 ， 另 一 种 被 称 为 “图 像 ” (Image》， 
也 叫 作 栅 格 图 像 、 点 阵 图 像 或 位 图 图 像 ， 它 是 用 像素 来 代表 图 像 ， 每 个 像素 都 被 分 配 一 个 特定 
位 置 和 颜色 值 。 

(1) 图 形 。 由 矢量 表示 的 图 形 是 用 一 系列 计算 机 指令 来 描述 和 记录 的 一 幅 图 的 内 容 ， 即 通 
过 指令 描述 构成 一 幅 图 的 所 有 直线 、 曲 线 、 圆 、 圆 弧 、 甜 形 等 图 元 的 位 置 、 维 数 和 形状 ， 也 可 
以 用 更 加 复杂 的 形式 表示 图 像 中 的 曲面 、 光 照 、 材 质 等 效果 。 矢 量 图 法 实质 上 是 用 数学 的 方式 
〈 算 法 和 特征 ) 来 描述 一 幅 图 ， 在 处 理 图 形 时 根据 图 元 对 应 的 数学 表达 式 进 行 编辑 和 处 理 。 在 
屏幕 上 显示 一 幅 图 形 时， 首先 要 解释 这 些 指令 ， 然 后 将 描述 图 形 的 指令 转换 成 屏幕 上 显示 的 形 
状 和 颜色 。 编 辑 矢量 图 的 软件 通常 称 为 绘图 软件 ， 如 绘制 机 械 图 、 电 路 图 的 AutoCAD 软件 等 。 

(2) 图 像 。 图像 是 指 用 像素 点 来 描述 的 图 。 图 像 一 般 是 用 摄像 机 或 扫描 仪 等 输入 设备 捕捉 
实际 场景 画面 ， 离 散 化 为 空间 、 亮 度 、 颜 色 〈 灰 度 ) 的 序列 值 ， 即 把 一 幅 彩 色 图 或 灰 度 图 分 成 
许 许 多 多 的 像素 (点 ) ， 每 个 像素 用 若干 二 进 制 位 来 指定 该 像素 的 颜色 、 亮 度 和 属性 。 位 图 图 
像 在 计算 机 内 存 中 由 一 组 二 进 制 位 组 成 ， 这 些 位 定义 图 像 中 每 个 像素 点 的 颜色 和 亮度 。 屏 幕 上 
的 一 个 点 也 称 为 一 个 像素 ， 显 示 一 幅 图 像 时 ， 屏 幕 上 的 像素 与 图 像 中 的 点 相对 应 。 根 据 组 成 图 
像 的 像素 密度 和 表示 颜色 、 亮 度 级 别 的 数目 ， 又 可 将 图 像 分 为 二 值 (黑白 ) 图 像 、 灰 度 图 像 和 
彩色 图 像 等 类 别 。 彩 色 图 像 还 可 以 分 为 真 彩色 图 像 、 伪 彩色 图 像 等 。 图 像 适 合 表现 比较 细腻 、 
层次 较 多 、 色 彩 较 丰富 、 包 含 大量 细 节 的 图 ， 并 可 直接 、 快 速 地 在 屏幕 上 显示 出 来 。 
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图 形 和 图 像 之 间 在 一 定 的 条 件 下 可 以 转换 ， 如 采用 光栅 化 点 阵 化 技术 可 以 将 图 形 转 换 
成 图 像 ; 采用 图 形 跟踪 技术 可 以 将 图 像 转换 成 图 形 。 一 般 可 以 通过 硬件 (输入 /输出 设备 ) 或 软 
件 实现 图 形 和 图 像 之 间 的 转换 。 


1. 颜色 


颜色 是 创建 图 像 的 基础 ， 在 计算 机 系统 中 有 一 套 特定 的 记录 和 处 理 颜色 的 技术 。 颜 色 是 通 
过 光 被 人 们 感知 的 ， 不 同 的 物体 受 光 线 照 射 后 ， 一 部 分 光线 被 吸收 ， 其 余 的 被 反射 到 人 的 眼中 
并 被 大 脑 感知 ， 成 为 人 们 所 见 的 物体 的 颜色 表达 。 所 以 ， 颜 色 和 光 有 密切 关系 ， 同 时 还 与 被 光 
照射 的 物体 有 关 ， 并 与 观察 者 有 关 。 

光 作 用 于 人 眼 ， 使 之 产生 颜色 视觉 。 为 了 能 确切 地 表示 某 一 颜色 光 的 度量 ， 可 以 用 色调 、 
饱和 度 和 亮度 3 个 物理 量 来 描述 ， 并 称 之 为 颜色 的 三 要 素 。 

(1) 色调 。 色 调 是 指 颜色 的 类 别 ， 如 红色 、 绿 色 、 蓝 色 等 不 同上 颜色， 大致 对 应 光谱 分 布 中 
的 主 波长 。 某 一 物体 的 色调 取决 于 它 本 身 辐 射 的 光谱 成 分 或 在 光 的 照射 下 所 反射 的 光谱 成 分 对 
人 眼 刺 激 的 视觉 反应 。 

(2) 饱和 度 。 饱 和 度 是 指 某 一 颜色 的 深浅 程度 (或 浓度 ) 。 对 于 同一 种 色调 的 颜色 ， 其 饱 
和 度 越 高 ， 颜 色 越 浓 ， 饱 和 度 越 低 ， 颜 色 越 淡 。 高 饱和 度 的 彩色 光 可 因 掺 入 白光 而 降低 纯度 或 
变 浅 ， 变 为 低 饱 和 度 的 彩色 光 。 因 此 ， 饱 和 度 可 以 用 某 色 调 的 纯色 掺 入 白色 光 的 比例 来 表达 。 

(3) 亮度 。 亮 度 是 描述 光 作用 于 人 眼 时 引起 的 明暗 程度 感觉 ， 是 指 彩色 明暗 深浅 程度 。 一 
般 来 说 ， 对 于 发 光 物 体 ， 彩 色光 辐射 的 功率 越 大 ， 亮 度 越 高 ， 反 之 ， 亮 度 越 低 。 对 于 不 发 光 的 
物体 ， 其 亮度 取决 于 吸收 或 者 反射 光 功 率 的 大 小 。 

1) 三 基色 原理 

从 理论 上 讲 ， 任 何 一 种 颜色 都 可 以 用 3 种 基本 颜色 按 不 同比 例 混合 得 到 。 自 然 界 中 常见 的 
各 种 颜色 光 都 可 由 红 (Red) 、 绿 (Green) 、 蓝 (Blue) 这 3 种 颜色 光 按 不 同比 例 混合 来 等 效 
表示 。 同 样 ， 绝 大 多 数 颜色 光 也 可 以 分 解 成 红 、 绿 、 蓝 3 种 颜色 光 ， 这 就 是 色 度 学 中 最 基本 的 
三 基色 原理 。 把 3 种 基色 光 按 不 同比 例 相 加 称 之 为 相 加 混 色 ， 由 红 、 绿 、 蓝 三 基色 进行 相 加 混 
色 的 情况 如 下 。 

红色 + 绿色 = 黄色 

红色 + 蓝 色 = 品 

绿色 + 蓝 色 = 青色 

红色 + 绿色 + 蓝 色 = 白 色 

红色 + 青色 = 绿色 + 品 红 = 蓝 色 + 黄 色 = 白 色 

若 两 种 色光 混合 形成 白光 ， 则 这 两 种 色光 互 为 补 色 。 

当然 ， 三 基色 的 选择 不 是 唯一 的 ， 可 以 选择 其 他 3 种 相互 独立 的 颜色 为 三 基色 。 由 于 人 眼 


国 62 计数 据 库 系统 工程 师 教程 (第 3 版 ) 


对 红 、 绿 、 蓝 这 3 种 颜色 光 最 敏感 ， 因 此 由 这 3 种 颜色 相配 所 得 的 彩色 范围 也 最 广 ， 一 般 选 这 


3 种 颜色 作为 基色 。 
2) 颜色 模型 
颜色 模型 是 用 


来 精确 标定 和 生成 各 种 颜色 的 一 套 规则 和 定义 。 某 种 颜色 模型 所 能 标定 的 所 


有 颜色 就 构成 了 一 个 颜色 空间 。 颜 色 空间 通常 用 三 维 模型 表示 ， 空 间 中 的 颜色 通常 使 用 代表 3 
个 参数 的 三 维 坐标 来 指定 。 颜 色 模 型 和 空间 用 来 表示 、 存 储 、 显 示 及 打印 彩色 图 像 ， 不 同 的 颜 


色 模 型 对 应 不 同 的 应 用 场合 ， 各 有 其 特点 。 


(1) RGB 颜色 模型 。RGB 颜色 模型 也 称 加 色 模 型 ， 通 过 对 红 、 绿 和 蓝 色光 不 同比 例 混合 


相 加 得 到 不 同 的 颜色 。 自 发 光 的 彩色 显示 器 一 般 都 使 用 RGB 颜色 模型 。 


(2) CMY 颜色 模型 。 在 RGB 颜色 模型 中 ， 不 同 颜色 的 光 是 通过 相 加 混合 实现 的 ， 彩 色 印 
刷 的 纸张 本 身 是 不 发 光 的 ， 它 使 用 能 够 吸收 特定 波长 范围 的 光 反 射 其 他 光波 的 油墨 或 颜料 来 实 


现 不 同 颜色 的 表现 


。 因 此 用 油墨 或 颜料 进行 混合 得 到 不 同 颜色 的 模型 称 为 减 色 模型 。 以 打印 在 


纸张 上 油墨 的 光线 吸收 特性 为 基础 ， 白 光照 射 到 半 透 明 油墨 上 时 ， 部 分 光谱 被 吸收 ， 部 分 被 反 
射 回 眼 睛 。CMY 模型 使 用 了 青色 〈Cyan) 、 品 红色 〈Magenta) 和 黄色 〈Yellow) 颜料 ， 可 以 


用 这 3 种 颜色 的 油墨 或 颜料 按 不 同比 例 混 合 来 表现 不 同 的 颜色 。 


(3) YUV 颜色 模型 。 在 处 理 彩 色 视 频 信 号 时 ， 为 了 兼容 黑白 电视 信号 ， 且 可 以 利用 人 的 
视觉 特性 以 降低 信号 带宽 ， 通 常 把 RGB 空间 表示 的 彩色 图 像 变 换 到 亮度 和 色 度 分 离 的 颜色 空 
间 。YUV 颜色 模型 定义 在 PAL 制式 的 彩色 电视 系统 中 ， 使 用 亮度 信号 Y、 色 差 信号 U (R-Y) 
和 V (B-Y) 。 由 于 亮度 和 色 度 是 分 离 的 ， 解 决 了 彩色 和 黑白 显示 系统 的 兼容 问题 ， 如 果 只 有 
立 分 量 而 没有 U、YV 分 量 ， 那 么 所 表示 的 图 像 是 灰 度 图 像 。 


2， 图像 数据 获取 


将 现实 世界 的 


景物 或 物理 介质 上 的 图 文 输入 计算 机 的 过 程 称 为 图 像 的 获取 〈Capturing) 。 


在 多 媒体 应 用 中 基本 图 像 可 通过 不 同 的 方式 获得 , 一 般 来 说 , 可 以 直接 利用 数字 图 像 库 的 图 像 ， 


或 者 利用 绘图 软件 创建 图 像 ， 也 可 以 利用 数字 转换 设备 采集 图 像 。 


图 像 编 辑 软件 


大 多 具有 较 强 的 功能 和 图 形 用 户 接口 ， 还 可 以 利用 鼠标 、 画 笔 、 画 板 来 绘制 


各 种 图 形 ， 并 进行 彩色 、 纹 理 、 图 案 等 的 填充 和 加 工 处 理 。 对 于 一 些小 型 的 图 形 、 图 标 、 按 钮 
等 ， 直 接 制 作 很 方便 ， 但 这 不 足以 描述 自然 景物 和 人 像 。 当 然 ， 也 有 一 些 较 专 业 的 绘画 软件 ， 
通过 数字 化 画板 和 画笔 在 屏幕 上 绘画 。 这 种 软件 要 求 绘画 者 具有 一 定 的 美术 知识 及 创意 基础 。 


数字 转换 设备 


可 以 把 采集 到 的 图 像 转换 成 计算 机 能 够 记录 和 处 理 的 数字 图 像 数据 。 例 如 ， 


对 印刷 品 、 照 片 或 照相 底片 等 进行 扫描 ， 用 数字 相机 或 数字 摄像 机 对 选 定 的 景物 进行 拍摄 等 。 
从 现实 世界 中 获取 数字 图 像 所 使 用 的 设备 统称 为 图 像 获 取 设备 。 一 幅 彩色 图 像 可 以 看 作 二 维 连 
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续 函 数 ftx, y)， 其 彩色 f 是 坐标 (x, y) 的 函数 ， 从 二 维 连续 函数 到 离散 的 矩阵 表示 同样 包含 采 
样 、 量 化 和 编码 的 数字 化 过 程 。 数 字 转 换 设备 获取 图 像 的 过 程 实质 上 是 信号 扫描 和 数字 化 的 过 
程 ， 它 的 处 理 步骤 大 体 分 为 以 下 三 步 。 

(1) 采样 。 在 x、y 坐标 上 对 图 像 进行 采样 〈 也 称 为 扫描 》 ， 类 似 于 声音 信号 在 时 间 轴 上 
的 采样 要 确定 采样 频率 一 样 ， 在 图 像 信 号 坐标 轴 上 的 采样 也 要 确定 一 个 采样 间隔 ， 这 个 间隔 即 
为 图 像 分 辨 率 。 有 了 采样 间隔 ， 就 可 以 逐 行 对 原始 图 像 进行 扫描 。 首 先 设 坐标 不 变 ， 对 x 轴 
按 采 样 间隔 得 到 一 行 离散 的 像素 点 x 及 相应 的 像素 值 。 使 y 坐标 也 按 采样 间隔 由 小 到 大 变化 ， 
就 可 以 得 到 一 个 离散 的 像素 矩阵 [x,, ys]， 每 个 像素 点 有 一 个 对 应 的 色彩 值 。 简 单 地 说 ， 将 一 幅 
画面 划分 为 MXN 个 网 格 ， 每 个 网 格 称 为 一 个 取样 点 ， 用 其 亮度 值 来 表示 。 这 样 ， 一 幅 连 续 的 
图 像 就 转换 为 以 取样 点 值 组 成 的 一 个 阵列 (矩阵 )。 

(2) 量化 。 将 扫描 得 到 的 离散 的 像素 点 对 应 的 连续 色彩 值 进行 A/D 转换 量化) ， 量 化 的 
等 级 参数 即 为 图 像 深度 。 这 样 ， 像 素 矩 阵 中 的 每 个 点 (x,, y， 都 有 对 应 的 离散 像素 值 f。 

(3) 编码 。 把 离散 的 像素 矩阵 按 一 定 的 方式 编 成 二 进 制 码 组 ， 最 后 ， 把 得 到 的 图 像 数据 按 
某 种 图 像 格式 记录 在 图 像 文件 中 。 


3. 图 像 的 属性 


图 像 的 属性 包含 分 辨 率 、 像 素 深度 、 真 / 伪 彩 色 、 图 像 的 表示 法 和 种 类 等 。 

(1) 分 辨 率 

图 像 分 辩 率 和 显示 分 辨 率 是 两 个 不 同 的 概念 ,图 像 分 辩 率 确定 的 是 组 成 一 幅 图 像 的 像素 数 
目 ， 而 显示 分 辨 率 指 的 是 显示 设备 能 够 显示 图 像 的 区 域 大 小 。 它 们 之 间 的 关系 为 ， 图 像 分 辨 率 
大 于 显示 分 辩 率 时 ， 在 屏幕 上 只 能 显示 部 分 图 像 ， 图 像 分 辩 率 小 于 显示 分 辨 率 时 ， 图 像 只 占 屏 
幕 的 一 部 分 。 

显示 分 辨 率 一 般 用 显示 设备 水 平方 向 和 垂直 方向 上 的 最 大 像素 数目 来 表示 。 例 如 ， 显 示 分 
辨 率 为 1024X768 表示 显示 屏 分 成 768 行 〈 垂 直 分 辨 率 ) ， 每 行 〈 水 平分 辩 率 ) 显示 1024 个 
像素 。 图 像 分 辨 率 也 使 用 图 像 的 水 平方 向 和 垂直 方向 上 的 像素 数码 来 表示 。 对 应 打印 设备 或 图 
像 扫描 设备 , 一 般 使 用 其 处 理 能 力 即 每 英寸 的 像素 点 数 (dpi) 来 表示 其 分 辨 率 。 例 如 , 用 200dpi 
来 扫描 一 幅 2X2.5 平方 英寸 的 彩色 照片 ， 可 以 得 到 一 幅 400X 500 个 像素 点 的 图 像 。 

(2) 像素 深度 

像素 深度 是 指 存 储 每 个 像素 所 用 的 二 进 制 位 数 ， 它 也 是 用 来 度量 图 像 的 色彩 分 辩 率 的 。 像 
素 深度 确定 彩色 图 像 的 每 个 像素 可 能 有 的 颜色 数 ， 或 者 确定 灰 度 图 像 的 每 个 像素 可 能 有 的 灰 度 
级 数 。 它 决定 了 彩色 图 像 中 可 出 现 的 最 多 颜色 数 ， 或 灰 度 图 像 中 的 最 大 灰 度 等 级 。 如 一 幅 图 像 
的 图 像 深度 为 b 位 ， 则 该 图 像 的 最 多 颜色 数 或 灰 度 级 为 2 种 。 显 然 ， 表示 一 个 像素 颜色 的 位 数 


站 64 若 。 数据库 系统 工程 师 教程 (第 3 版) 


越 多 ， 它 能 表达 的 颜色 数 或 灰 度 级 就 越 多 。 例 如 ， 只 有 1 个 分 量 的 单 色 图 像 ， 若 每 个 像素 有 8 
位 ， 则 最 大 灰 度数 目 为 2=256。 一 幅 彩 色 图 像 的 每 个 像素 用 R、G、B 这 3 个 分 量 表示 ， 若 3 
个 分 量 的 像素 位 数 分 别 为 4、4、2， 则 最 大 颜色 数目 为 2”…-2"-1024， 也 就 是 说 ， 像 素 的 深 
度 为 10 位 ， 每 个 像素 可 以 是 2 种 颜色 中 的 一 种 。 用 来 表示 一 个 像素 的 位 数 越 多 ， 它 能 表达 的 
颜色 数目 就 越 多 ， 它 的 深度 也 就 越 深 。 

(3) 真 彩色 和 伪 彩 色 

真 彩色 (True Color) 是 指 组 成 一 幅 彩 色 图 像 的 每 个 像素 值 中 有 R、G、B 这 3 个 基色 分 量 ， 
每 个 基色 分 量 直接 决定 显示 设备 的 基色 强度 。 例 如 ，R、G、B 分 量 都 用 8 位 来 表示 ， 可 生成 的 
颜色 数 就 是 24 种 ， 每 个 像素 的 颜色 就 是 由 其 中 的 数值 直接 决定 的 。 这 样 得 到 的 色彩 可 以 反映 
原 图 像 的 真实 色彩 ， 称 之 为 真 彩色 。 

在 生成 图 像 时 ， 对 图 像 中 的 不 同色 彩 进行 采样 ， 产 生 包含 各 种 颜色 的 颜色 表 ， 即 色彩 查找 
表 。 图 像 中 每 个 像素 的 颜色 不 是 由 3 个 基色 分 量 的 数值 直接 表达 ， 而 是 把 像素 值 作 为 地 址 索引 
在 色彩 查找 表 中 查找 这 个 像素 实际 的 R、G、B 分 量 ， 将 图 像 的 这 种 颜色 表达 方式 称 为 伪 彩 色 。 
需要 说 明 的 是 ， 对 于 这 种 伪 彩 色 图 像 的 数据 除了 保存 代表 像素 颜色 的 索引 数据 外 ， 还 要 保存 一 
个 色彩 查找 表 〈 调 色 板 ) 。 色 彩 查 找 表 可 以 是 一 个 预先 定义 的 表 ， 也 可 以 是 对 图 像 进行 优化 后 
产生 的 色彩 表 。 常 用 的 256 色 的 彩色 图 像 使 用 了 8 位 的 索引 ， 即 每 个 像素 占用 一 个 字 节 。 


4. 图像 的 压缩 编码 


在 扫描 生成 一 幅 图 像 时 ， 实 际 上 是 按 一 定 的 图 像 分 辩 率 和 一 定 的 像素 深度 对 模拟 图 片 或 照 
片 进行 采样 ， 从 而 生成 一 幅 数 字 化 的 图 像 。 图 像 的 图 像 分 辩 率 越 高 ， 像 素 深度 越 深 ， 则 数字 化 
后 的 图 像 效 果 越 逼真 , 图 像 数 据 量 也 越 大 。 如果 按照 像素 点 及 其 深度 映射 的 图 像 数 据 大 小 采样 ， 
可 用 下 面 的 公式 计算 数据 量 : 

图 像 数据 量 = 图 像 的 总 像素 数 X 像 素 深度 /8 (Byte) 
例如 ， 一 幅 640X480 的 256 色 图 像 ， 其 数据 量 为 : 
640X480X8/8 = 300kB 

可 见 ， 数 字 图 像 的 数据 量 也 很 大 ， 需 要 很 大 的 存储 空间 存储 图 像 数 据 。 更 为 重要 的 是 ， 在 
现代 通信 中 ， 特 别 是 因特网 上 开展 的 各 种 应 用 中 ， 图 像 传输 速度 是 一 项 很 重要 的 指标 。 采 用 压 
缩编 码 技术 ， 减 少 图 像 的 数据 量 是 提高 网 络 传输 速度 的 重要 手段 。 

数据 压缩 可 分 成 两 类 ， 即 无 损 压 缩 和 有 损 压 缩 。 

(1) 无 损 压缩 。 无 损 压 缩 方 法 是 指 压缩 前 和 解压 缩 后 的 数据 完全 一 致 。 常 见 的 无 损 压缩 技 
术 包 括 业 编码 技术 〈 如 香农 - 范 诺 编码 、 霍 夫 曼 编码 、 算 术 编 码 ) 、 行 程 编 码 技 术 、 无 损 预 测 编 
码 技 术 〈 如 无 损 DPCM) 及 词典 编码 技术 〈 如 LZ97、LZSS、LZW) 等 。 
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(2) 有 损 压 缩 。 有 损 压 缩 意味 着 解压 缩 后 的 数据 与 压缩 前 的 数据 并 非 完全 相同 ， 在 压缩 的 
过 程 中 有 不 可 恢复 的 信息 丢失 ， 但 对 于 多 媒体 信息 的 压缩 编码 允许 一 定 的 信息 失真 ， 比 如 人 眼 
和 人 耳 所 不 敏感 的 图 像 或 声音 信息 ， 允 许 在 可 接受 的 感知 失真 度 之 下 损失 部 分 信息 已 获取 极 高 
的 压缩 率 。 有 损 压 缩 技术 广泛 应 用 于 多 媒体 信息 的 压缩 编码 中 。 

计算 机 中 使 用 的 静态 图 像 压缩 编码 方法 有 多 种 国际 标准 和 工业 标准 。 目 前 使 用 最 广泛 的 编 
码 标准 就 是 JPEG。 

JPEG (Joint Photographic Experts Group) 是 一 个 由 ISO 和 IEC 两 个 组 织 机 构 联合 组 成 的 专 
家 组 ， 负 责 制 定 静 态 和 数字 图 像 数 据 压缩 编码 标准 ， 这 个 专家 组 开发 的 算法 称 为 卫 EG 算法 ， 
并 且 成 为 国际 上 通用 的 标准 ,因此 又 称 为 PEG 标准 。JPEG 是 一 个 适用 范围 很 广 的 静态 图 像 数 
据 压 缩 标 准 ， 适 用 于 连续 色调 的 静态 图 像 编 码 ， 既 可 用 于 灰 度 图 像 又 可 用 于 真 彩色 图 像 。JPEG 
专家 组 开发 了 两 种 基本 的 压缩 算法 ， 一 种 是 以 离散 余弦 变换 (Discrete Cosine Transform, DCT) 
为 基础 的 有 损 压 缩 算法 ， 另 一 种 是 采用 以 DPCM 为 基础 的 无 损 压 缩 算法 。 


5， 图 像 文 件 格式 


数字 图 像 在 计算 机 中 存储 时 ， 可 有 多 种 文件 格式 ， 下 面 简单 介绍 几 种 常用 的 文件 格式 。 

(1) BMP 文件 (.bmp) 。Windows 操作 系统 采用 的 一 种 图 像 文 件 格式 。 它 是 一 种 与 设备 
无 关 的 位 图 格式 ， 目 的 是 为 了 让 Windows 能 够 在 任何 类 型 的 显示 设备 上 输出 所 存储 的 图 像 。 
BMP 采用 位 映射 存储 格式 ， 除了 图 像 深度 可 选 以 外 ,一 般 不 采用 其 他 任何 压缩 ， 所 以 占用 的 存 
储 空间 较 大 。BMP 文件 的 图 像 深 度 可 选 1 位 、4 位 、8 位 及 24 位 ， 即 有 黑白 、16 色 、256 色 和 
真 彩色 之 分 。 

(2) GIF 文件 (.gif) 。CompuServe 公司 开发 的 图 像 文 件 格式 ， 它 以 数据 块 为 单位 来 存储 
图 像 的 相关 信息 。GIF 文件 格式 采用 了 LZW (Lempel-Ziv Welch) 无 损 压 缩 算 法 按 扫 描 行 压缩 
图 像 数据 。 它 可 以 在 一 个 文件 中 存放 多 幅 彩 色 图 像 ， 每 一 幅 图 像 都 由 一 个 图 像 描 述 符 、 可 选 的 
局 部 彩色 表 和 图 像 数 据 组 成 。 如 果 把 存储 于 一 个 文件 中 的 多 幅 图 像 逐 幅 读 出 来 显示 到 屏幕 上 ， 
可 以 像 播 放 幻灯 片 那样 显示 或 者 构成 简单 的 动画 效果 。GIF 的 图 像 深 度 为 1 一 8 位 ， 即 最 多 支持 
256 种 色彩 的 图 像 。 

GIF 文件 格式 定义 了 两 种 数据 存储 方式 ， 一 种 是 按 行 连续 存储 ， 存 储 顺序 与 显示 器 的 显示 
顺序 相同 ， 另 一 种 是 按 交 叉 方 式 存储 ， 由 于 显示 图 像 需 要 较 长 的 时 间 ， 使 用 这 种 方法 存放 图 像 
数据 , 用户 可 以 在 图 像 数据 全 部 收 到 之 前 浏览 这 幅 图 像 的 全 貌 , 而 不 觉得 等 待 时 间 太 长 。 目 前 ， 
GIF 文件 格式 在 HTML 文档 中 得 到 广泛 使 用 。 

(3) TIFF 文件 (.tif) 。 由 Aldus 和 Microsoft 公司 为 扫描 仪 和 桌面 出 版 系统 研制 开发 的 
种 通用 的 图 像 文 件 格式 。TIFF 格式 非常 灵活 易 变 ， 它 又 定义 了 4 类 不 同 的 格式 ， 其 中 ，TIFF-B 
适用 于 二 值 图 像 ，TIFF-G 适用 于 黑白 灰 度 图 像 ，TIFF-P 适用 于 带 调 色 板 的 彩色 图 像 ，TIFF-R 
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适用 于 RGB 真 彩 图 像 。 无 论 在 视觉 上 还 是 在 其 他 方面 ， 都 能 把 任何 图 像 编码 成 二 进 制 形 式 而 
不 丢失 任何 属性 。 

(4) PCX 文件 (.pcx) 。PC Paintbrush (PC 画笔 ) 的 图 像 文件 格式 。PCX 的 图 像 深度 可 选 
为 1 位 、4 位 、8 位 , 对 应 单 色 、16 色 及 256 色 , 不 支持 真 彩色 。PCX 文件 采用 RLE 行程 编码 ， 
文件 体 中 存放 的 是 压缩 后 的 图 像 数据 。 因 此 , 在 将 采集 到 的 图 像 数 据 写成 PCX 格式 文件 时 ， 要 
对 其 进行 RLE 编码 ; 而 读 取 一 个 PCX 文件 时 ， 首先 要 对 其 进行 解码 ,才能 进一步 显示 和 处 理 。 

(5) PNG 文件 格式 。 它 是 作为 GIF 的 替代 品 而 开发 的 ， 能 够 避免 使 用 GIF 文件 所 遇 到 的 
常见 问题 。 它 从 GIF 那里 继承 了 许多 特征 ， 增 加 了 一 些 GIF 文件 所 没有 的 特性 。 当 用 来 存储 灰 
度 图 像 时 ， 灰 度 图 像 的 深度 可 达 16 位 ; 存储 彩色 图 像 时 ， 彩 色 图 像 的 深度 可 达 48 位 。PNG 文 
件 格式 支持 无 损 数据 压缩 。 

(6) JPEG 文件 〈;jpg) 。 采 用 JPEG 压缩 算法 ， 其 压缩 比 为 :1 一 50:1， 甚 至 更 高 。 对 一 幅 
图 像 按 了 PEG 格式 进行 压缩 时 ， 可 以 根据 压缩 比 与 压缩 效果 要 求 选 择 压 缩 质 量 因 子 。JPEG 格式 
文件 的 压缩 比例 很 高 ， 非 常 适用 于 要 处 理 大 量 图 像 的 场合 ， 它 是 一 种 有 损 压 缩 的 静态 图 像 文件 
存储 格式 ， 压 缩 比例 可 以 选择 ， 支 持 灰 度 图 像 、RGB 真 彩色 图 像 和 CMYK 真 彩色 图 像 。 

(7) WMF 文件 (.wmf) 。 只 用 在 Windows 中 ， 它 保存 的 不 是 点 阵 信 息 ， 而 是 函数 调用 信 
息 。 它 将 图 像 保存 为 一 系列 GDI (图 形 设备 接口 ) 的 函数 调用 ， 在 恢复 时 ， 应 用 程序 执行 源 文 
件 〈 即 执行 一 个 个 函数 调用 ) 在 输出 设备 上 画 出 图 像 。WMEF 文件 具有 设备 无 关 性 ， 文 件 结构 
好 ， 但 是 解码 复杂 ， 其 效率 比较 低 。 


1.4.4 动画 和 视频 


动画 是 将 静态 的 图 像 、 图 形 及 图 画 等 按 一 定 的 时 间 顺 序 显 示 而 形成 连续 的 动态 画面 。 从 传 
统 意义 上 说 ， 动 画 是 通过 在 连续 多 格 的 胶片 上 拍摄 一 系列 画面 ， 并 将 胶片 以 一 定 的 速度 放映 ， 
从 而 产生 动态 视觉 的 技术 和 艺术 。 
视频 信息 是 指 活动 的 、 连 续 的 图 像 序列 。 一 幅 图 像 称 为 一 帧 ， 帧 是 构成 视频 信息 的 基本 单 
元 。 在 多 媒体 应 用 系统 中 ， 视 频 以 其 直观 、 生 动 等 特点 得 到 广泛 的 应 用 。 视 频 与 动画 一 样 ， 是 
图 像 帧 序列 组 成 的 ， 这 些 帧 以 一 定 的 速率 播放 ， 使 观看 者 得 到 连续 运动 的 感觉 。 
1. 动画 
一 般 来 说 ， 动 画 是 一 种 动态 生成 一 系列 相关 画面 的 处 理 方法 ， 其 中 的 每 一 幅 与 前 一 幅 略 有 
不 同 。 计 算 机 动画 是 采用 连续 播放 静止 图 像 的 方法 产生 景物 运动 的 效果 ， 即 使 用 计算 机 产生 图 
形 、 图 像 运动 的 技术 。 动 画 的 内 容 不 仅 是 实体 在 运动 ， 而 且 色调 、 文 理 、 光 影 效果 也 可 以 不 断 
改变 。 计 算 机 生成 的 动画 不 仅 可 记录 在 胶片 上 ， 而 且 可 以 记录 在 磁带 、 磁 盘 和 光盘 上 ， 放 映 时 
不 仅 使 用 计算 机 显示 器 显示 ， 而 且 可 以 使 用 电视 机 屏幕 显示 以 及 使 用 投影 仪 投影 到 银幕 的 方法 
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显示 。 在 多 媒体 应 用 中 ， 计 算 机 动画 可 以 十 分 简单 ， 也 可 以 十 分 复杂 ， 从 某 个 对 象 、 物 体 的 运 
动 到 电视 广告 、 动 画 片 等 。 

动画 的 本 质 是 运动 。 根 据 运动 的 控制 方式 可 将 计算 机 动画 分 为 实时 动画 和 逐 帧 动画 两 种 。 
实时 动画 是 用 算法 来 实现 物体 的 运动 ， 逐 帧 动画 是 在 传统 动画 基础 上 引申 而 来 的 ， 也 即 通 过 一 
帧 一 帧 显示 动画 的 图 像 序列 而 实现 运动 的 效果 。 根 据 视 觉 空间 的 不 同 ， 计 算 机 动画 又 有 二 维 动 
画 和 三 维 动画 之 分 。 

1) 实时 动画 

实时 动画 采用 各 种 算法 来 实现 运动 物体 的 运动 控制 ， 采 用 的 算法 有 运动 学 算法 、 动 力学 算 
法 、 反 向 运动 学 算法 、 反 向 动力 学 算法 和 随机 运动 算法 等 。 在 实时 动画 中 ， 计 算 机 对 输入 的 数 
据 进行 快速 处 理 ， 并 在 人 眼 察觉 不 到 的 时 间 内 将 结果 随时 显示 出 来 。 实 时 动画 的 响应 时 间 与 许 
多 因素 有 关 ， 如 动画 图 像 大 小 、 动 画图 像 复 杂 程 度 、 运 算 速度 快慢 (计算 机 〉 以 及 图 形 的 计算 
是 采用 软件 还 是 硬件 等 。 

2) 矢量 动画 

矢量 动画 是 由 矢量 图 衍生 出 的 动画 形式 。 矢 量 图 是 利用 数学 函数 来 记录 和 表示 图 形 线条 、 
颜色 、 尺 寸 和 坐标 等 属性 ， 矢 量 动画 通过 各 种 算法 实现 各 种 动画 效果 ， 如 位 移 、 变 形 和 变色 等 。 
也 就 是 说 ， 矢 量 动画 是 通过 计算 机 的 处 理 使 矢量 图 产生 运动 效果 形成 的 动画 。 使 用 矢量 动画 ， 
可 以 使 一 个 物体 在 屏幕 上 运动 ， 并 改变 其 形状 、 大 小 、 颜 色 、 透 明度 、 旋 转角 度 以 及 其 他 一 些 
属性 参数 。 矢 量 动画 采用 实时 绘制 的 方式 显示 一 幅 矢 量 图 ， 当 图 形 放 大 或 缩小 时 ， 都 保持 光滑 
的 线条 ， 不 会 影响 质量 ， 也 不 会 改变 文件 的 容量 。 

3) 二 维 动画 

二 维 动画 是 对 传统 动画 的 一 个 改进 ， 它 不 仅 具 有 模拟 传统 动画 的 制作 功能 ， 而 且 可 以 发 挥 
计算 机 所 特有 的 功能 ， 如 生成 的 图 像 可 以 复制 、 粘 贴 、 翻 转 、 放 大 缩小 、 任 意 移 位 以 及 自动 计 
算 等 。 图 形 、 图 像 技 术 都 是 计算 机 动画 处 理 的 基础 。 图 像 是 指 用 像素 点 组 成 的 画面 ， 而 图 形 是 
指 几何 形体 组 成 的 画面 。 在 二 维 动画 处 理 中 ， 图 像 技术 有 利于 绘制 实际 景物 ， 可 用 于 绘制 关键 
帧 、 画 面 万 加 、 数 据 生 成 ， 图 形 技术 有 利于 处 理 线条 组 成 的 画面 ， 可 用 于 自动 或 半自动 的 中 间 
画面 生成 。 计 算 机 在 二 维 动画 中 的 作用 包括 输入 和 编辑 关键 帧 ， 计 算 和 生成 中 间 帧 ， 定 义 和 显 
示 运 动 路 径 ， 产 生 特技 效果 ; 实现 画面 与 声音 的 同步 ， 控 制 运动 系列 的 记录 等 。 二 维 动画 的 处 
理 主 要 包括 两 个 基本 步 又， 即 屏幕 绘画 和 动画 生成 。 屏 幕 绘画 主要 使 用 图 像 处 理 软件 完成 ， 有 
时 为 了 自动 或 半自动 生成 动画 ， 也 采用 图 形 方法 来 描述 画面 。 动画 生成 以 屏幕 绘画 的 结果 〈 作 
为 关键 帧 ) 为 基础 进行 生成 处 理 ， 最 终 完成 动画 创作 。 

4) 三 维 动画 

三 维 画 面 中 的 景物 有 正面 ， 也 有 侧面 和 反面 ， 调 整 三 维 空间 的 视点 ， 能 看 到 不 同 的 内 容 。 
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维 画 面 则 不 然 ， 无 论 怎么 看 ， 画 面 的 内 容 都 是 不 变 的 。 三 维 与 二 维 动画 的 区 别 主要 在 于 采用 
不 同 的 方法 获得 动画 中 的 景物 运动 效果 。 三 维 动画 的 制作 过 程 不 同 于 传统 动画 制作 。 根 据 剧情 
的 要 求 , 首先 要 建立 角色 、 实物 和 景物 的 三 维 数据 模型 , 再 对 模型 进行 光照 着 色 ( 真 实感 设计 )， 
然后 使 模型 动 起 来 ， 即 模型 可 以 在 计算 机 控制 下 在 三 维 空间 中 运动 , 或 近 或 远 , 或 旋转 或 移动 ， 
或 变形 或 变色 等 ， 最 后 对 运动 的 模型 重新 生成 图 像 再 刷新 屏幕 ， 形 成 运动 图 像 。 

建立 三 维 动画 物体 模型 称 为 造型 ， 也 就 是 在 计算 机 内 生成 一 个 具有 一 定形 体 的 几何 模型 。 
在 计算 机 中 大 致 有 3 种 形式 来 记录 一 个 物体 的 模型 。 

(1) 线 框 模型 。 用 线条 来 描述 一 个 形体 ， 一 般 包括 顶点 和 棱 边 ， 例 如 用 8 条 线 来 描述 一 个 
立方 体 。 

(2) 表面 模型 。 用 面 的 组 合 来 描述 形体 ， 例 如 用 6 个 面 来 描述 一 个 立方 体 。 

(3) 实体 模型 。 任 何 一 个 物体 都 可 以 分 解 成 若干 个 基本 形体 的 组 合 ， 例 如 一 个 立方 体 可 以 
分 解 为 各 种 形体 的 组 合 。 这 种 用 基本 形体 组 合 物体 的 模型 就 是 实体 模型 。 

三 维 动画 的 处 理 需 要 综合 使 用 上 述 3 种 模型 。 一 般 情况 下 ， 先 用 线 框 模型 进行 概念 设计 ， 
再 将 线 框 模型 处 理 成 表面 模型 以 方便 显示 ， 然 后 使 用 实体 模型 进行 动画 处 理 。 同 一 形体 的 3 种 
模型 可 以 相互 转换 。 

物体 模型 只 有 通过 光 和 色 的 演 染 才能 产生 自然 界 中 常见 的 真实 物体 效果 ,这 在 动画 中 称 为 
着 色 (真实 感 设 计 ) 。 对 物体 着 色 是 产生 真实 感 图 形 图 像 的 重要 过 程 ， 它 涉及 物体 的 材质 、 纹 
理 以 及 照射 的 光源 等 方面 。 

(1) 材质 。 描 述 任何 物体 ， 除 了 造型 以 外 ， 还 必须 有 一 定 的 附加 特征 〈 属 性) 来 指明 它 的 
外 在 特性 。 物体 的 外 在 特性 在 很 大 程度 上 取决 于 构成 它 的 材料 。 一 般 把 材料 的 性 质 简称 为 材质 ， 
不 同 的 材质 表现 出 的 质感 是 不 同 的 。 材质 主要 用 来 说 明 物 体 对 入 射 光 线 做 出 的 反应 。 一般 来 说 ， 
光线 或 者 被 反射 、 吸 收 ， 或 者 被 透射 、 折 射 。 反 射 的 色光 正 是 该 物体 呈现 的 颜色 ， 而 透射 、 折 
射 产生 的 色光 与 材质 有 很 大 的 关系 。 

(2) 纹理 。 纹 理 是 物体 的 表面 细节 ， 大 多 数 物体 的 表面 具有 纹理 。 有 了 纹理 可 以 改变 物体 
的 外 观 ， 甚 至 改变 其 形状 。 物 体 的 纹理 一 般 分 为 两 种 : 一 种 是 颜色 纹理 ， 如 墙 面 贴纸 、 陶 器 上 
的 图 案 等 ， 颜 色 纹 理 取决 于 物体 表面 的 光学 性 质 ， 另 一 种 是 几何 纹理 ， 如 人 的 皮肤 、 橘 子 的 福 
皱 等 ， 几 何 纹理 与 物体 表面 的 微观 几何 形状 有 关 。 

(3) 光源 。 在 给 一 个 场景 着 色 时 必须 知道 有 关 光 源 的 特性 ， 例 如 光源 的 位 置 、 颜 色 、 亮 度 
和 方向 等 ， 这 些 信息 要 由 用 户 通过 照明 模型 设 定 。 决 定 光照 射 到 物体 表面 并 形成 颜色 的 方法 称 
为 浓淡 处 理 。 浓 淡 处 理 要 用 到 物体 表面 的 几何 材质 信息 ， 并 对 入 射 光 进行 考察 ， 从 而 找 出 表面 
反射 的 色光 。 在 进行 浓淡 处 理 时 ， 一 般 对 每 个 物体 表面 的 每 一 个 点 分 别 进行 处 理 ， 而 且 仅 考虑 
来 自 光源 的 光照 效果 ， 不 考虑 来 自 其 他 物体 发 出 的 光 的 影响 。 
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三 维 动画 处 理 的 基本 目的 是 控制 形体 模型 的 运动 ， 获 得 运动 显示 效果 。 其 处 理 过 程 中 涉及 
建立 线 框 模型 、 表 面 模型 和 实体 模型 。 此 外 ， 一 个 好 的 三 维 动画 应 用 系统 能 够 将 形体 置 于 指定 
的 灯光 环境 中 ， 使 形体 的 色彩 在 灯光 下 生成 光线 反映 和 阴影 效果 。 运 动物 体 不 仅 表现 为 几何 位 
置 改 变 ， 还 带 有 光 、 色 、 受 力 、 碰 撞 以 及 物体 本 身 的 变形 等 。 动 画 控制 也 称 为 运动 模拟 。 首 先 ， 
计算 机 要 确定 每 个 物体 的 位 置 和 相互 关系 ， 建 立 其 运动 轨迹 和 速度 ， 选 择 运动 形式 〈 平 移 、 旋 
转 和 扭曲 等 ) 。 然 后 ， 需 要 确定 物体 形体 的 变态 方式 和 变异 速度 。 光 源 确 定好 了 以 后 ， 调 整 拍 
摄 的 位 置 、 方 向 、 运 动 轨迹 及 速度 ， 就 可 以 显示 观看 画面 效果 。 

三 维 动画 最 终 要 生成 一 幅 幅 二 维 画面 ， 并 按 一 定格 式 记 录 下 来 ， 这 个 过 程 称 为 动画 生成 。 
动画 生成 后 ， 可 以 在 屏幕 上 播放 ， 也 可 以 录制 到 光盘 或 录像 带 上 。 


2， 模拟 视频 


电视 是 当代 最 有 影响 的 多 媒体 信息 传播 工具 ， 在 综合 文 、 图 、 声 、 像 等 作为 信息 传播 媒体 
这 一 点 上 完全 与 多 媒体 系统 相同 ， 不 同 的 是 电视 系统 不 具备 交互 性 ， 传 播 的 信号 是 模拟 信号 。 
电视 信号 记录 的 是 连续 的 图 像 或 视 像 以 及 伴音 (声音 ) 信号 。 电 视 信号 通过 光栅 扫描 的 方法 显 
示 在 荧光 屏 (屏幕 ) 上 , 扫描 从 荧光 屏 的 顶部 开始 一 行 一 行 地 向 下 扫描 ， 直 到 荧光 屏 的 最 底部 
然后 返回 到 项 部 ， 重 新 开始 扫描 。 这 个 过 程 产生 的 一 个 有 序 的 图 像 信号 的 集合 组 成 了 电视 图 像 
中 的 一 幅 图 像 ， 称 为 一 帧 ， 连 续 不 断 的 图 像 序列 就 形成 了 动态 视频 图 像 。 水 平 扫描 线 所 能 分 辩 
出 的 点 数 称 为 水 平分 辨 率 ， 一 帧 中 垂直 扫描 的 行 数 称 为 垂直 分 辨 率 。 一 般 来 说 ， 点 越 小 ， 线 越 
细 ， 分 辩 率 越 高 。 每 秒 钟 所 扫描 的 帧 数 就 是 帧 频 ， 一 般 在 25 帧 每 秒 时 人 眼 就 不 会 感觉 到 闪烁 。 
彩色 电视 系统 采用 相 加 混 色 ， 使 用 RGB 作为 三 基色 进行 配色 ， 产 生 R、G、B 3 个 输出 信号 。 
RGB 信号 可 以 直接 传输 ， 也 可 以 转换 到 亮度 、 色 度 分 离 的 颜色 空间 后 再 传输 。 传 输 信号 通常 有 
3 种 方式 , 即 分 量 视频 (Component Video) 、 复 合 视频 (Composite Video) 和 分 离 视 频 (S-video) 
信号 。 

分 量 视频 使 用 3 根 信号 线 连接 视频 设备 (BNC 或 RCA 连接 器 ) 传送 信号 。 但 三 路 信号 不 
局 限于 RGB 三 色 信号 ， 可 通过 颜色 空间 变换 生成 亮度 -色差 信号 ， 比 如 YIQ 和 YUV 信号 。 复 
合 视频 用 于 彩色 电视 广播 ， 且 兼容 黑白 电视 广播 。 使 用 复合 视频 连接 设备 传送 信号 只 需要 一 根 
信号 线 (BNC 或 RCA 连接 器 ) ， 视 频 信号 中 亮度 和 色 度 信 号 是 混合 在 一 起 的 。 分 离 视频 信号 
连接 设备 使 用 称 为 S 端子 的 四 芯 连 接 器 ， 显 然 其 颜色 再 现 质量 介 于 分 量 视频 和 复合 视频 之 间 。 

电视 信号 的 标准 也 称 为 电视 的 制式 ， 目 前 世界 各 地 使 用 的 标准 不 完全 相同 ， 制 式 的 区 分 主 
要 在 于 其 帧 频 的 不 同 、 分 辩 率 的 不 同 、 信 号 带宽 及 载 频 的 不 同 、 彩 色 空间 的 转换 关系 不 同等 。 
世界 上 现行 的 彩色 电视 制式 主要 有 NTSC 制 、PAL 制 和 SECAM 制 3 种 ， 如 表 1-10 所 示 。 

美国 、 加 拿 大 、 日 本 、 韩 国 、 中 国 台 湾 、 菲 律 宾 等 国家 和 地 区 采用 NTSCM 制式 ; 德国 、 
英国 、 中 国 、 中国 香港 新西兰 等 国家 和 地 区 采用 PAL 制式 ; 法 国 、 东 欧 、 中 东 一 带 采 用 SECAM 
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制式 
电视 制式 (PAL) 采用 625 行 隔行 扫描 光栅 ， 分 两 场 扫描 。 行 扫描 频率 为 15625Hz,， 

周期 为 64hs;， 场 扫描 频率 为 50Hz， 周 期 为 20ms; 帧 频 是 2SHz， 电视 信 
号 时 , 每 一 行 中 传送 图 像 的 时 间 是 52.2hs, 对 应 行 扫描 的 正 程 时 间 , 其 余 的 11.8hs 不 传送 图 像 ， 
对 应 行 扫描 的 逆 程 时 间 加 入 行 消 隐 信 号 和 行 同 步 信 号 ， 这 样 不 影响 行 扫描 发 送 或 显示 图 像 信 
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表 1-10 彩色 数字 电视 制式 


帧 频 忆 亮度 带宽 彩色 副 载 波 声音 载波 
1.3 (I) 、0.6 
>1.0 (U) 、 
采用 隔行 扫描 比 采 用 逐 行 扫描 所 占用 的 信号 传输 带宽 要 减少 一 半 ， 这 样 有 利于 信道 的 利 


贞 每 秒 的 帧 频 (25Hz)〉 能 以 最 少 的 信号 容量 有 效 地 满 
因为 我 国 的 电网 频率 为 SOHz， 采 用 50Hz 的 场 刷 


用 ， 有 利于 信号 的 传输 和 处 理 。 采 用 25 
足 人 眼 的 视觉 残留 特性 。 采 用 50Hz 的 场 频 是 
新 频率 可 有 效 地 去 掉 电 网 信号 的 干扰 。 


3. 数字 视频 
计算 机 的 数字 视频 是 基于 数字 技术 的 图 像 显示 标准 ， 它 能 将 模拟 视频 信号 输入 到 计算 机 进 
行 数字 化 视频 编辑 制 成 数字 视频 。 电 视 机 、 激 光 视 盘 和 摄像 机 等 都 可 以 提供 丰富 多 彩 的 模拟 视 
频 信号 ， 常 党 需要 把 这 些 信号 与 计算 机 图 形 图 像 结合 在 一 个 共同 的 空间 ， 通 过 处 理 达到 最 佳 的 
效果 ， 然 后 输出 到 计算 机 的 显示 器 或 其 他 电视 设备 上 。 模 拟 视频 信号 进入 计算 机 ， 首 先 需 要 解 
次 模拟 视频 信息 的 数字 化 问题 。 与 音频 数字 化 一 样 ， 视 频数 字 化 的 目的 是 将 模拟 信号 经 模 / 数 转 
换 《A/D 转换 ) 和 彩色 空间 变换 等 过 程 ， 转 换 成 计算 机 可 以 显示 和 处 理 的 数字 信号 。 由 于 电视 
和 计算 机 的 显示 机 制 不 同 ， 因 此 要 在 计算 机 上 显示 视频 图 像 需要 做 许多 处 理 。 例 如 ， 电 视 是 了 
行 扫描 ， 计 算 机 的 显示 器 通常 是 逐 行 扫描 ， 电 视 是 亮度 (7) 和 色 度 C) 的 复合 编码 ， 而 PC 
的 显示 器 工作 在 RGB 空间 ， 电 视图 像 的 分 辩 率 和 显示 屏 的 分 辩 率 各 不 相同 等 。 这 些 问题 在 电 
视图 像 数字 化 过 程 中 者 需要 考虑 。 一 般 情 况 下 ， 对 模拟 视频 信息 进行 数字 化 可 以 采取 以 下 两 各 
方式 。 


上 
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(1) 先 从 复合 彩色 电视 图 像 中 分 离 出 彩色 分 量 ， 然 后 数字 化 。 即 将 复合 视频 信号 分 解 得 到 
YUV、YIQ 或 RGB 彩色 空间 的 分 量 信 号 ， 然 后 用 3 个 A/D 转换 器 分 别 进 行 数 字 化 ， 这 种 方式 
称 为 复合 数字 化 。 

(2) 先 对 全 彩色 电视 信号 数字 化 ， 然 后 在 数字 域 中 进行 分 离 ， 以 获得 YUV、YIQ 或 RGB 
分 量 信号 。 在 用 这 种 方法 对 电视 图 像 数字 化 时 ， 只 需 一 个 高 速 A/D 转换 器 。 这 种 方式 称 为 分 量 
数字 化 。 

视频 信息 数字 化 的 过 程 比 声 音 复杂 一 些 ， 它 是 以 一 幅 幅 彩色 画面 为 单位 进行 的 。 数 字 视 频 
使 用 的 颜色 模型 是 YC,C.， 此 模型 接近 YUV 模型 ，Cu 和 C: 分 别 代表 蓝 色 差 和 红色 差 信 号 ， 即 
每 幅 彩 色 画 面 有 亮度 (Z) 和 色 度 3 个 分 量 。 由 于 人 眼 对 色 度 信号 的 敏感 程度 远 不 如 对 亮度 信 
号 那么 灵敏 ， 所 以 色 度 信号 的 取样 频率 可 以 比 亮度 信号 的 取样 频率 低 一 些 ， 以 减少 数字 视频 的 
数据 量 ， 这 种 方式 称 为 色 度 子 采样 (Chroma Sub-sampling) 。 目 前 ， 常 用 的 色 度 信号 子 采样 模 
式 如 表 1-11 所 示 。 


表 1-11 色 度 信号 取样 格式 
说 了 明 

指 在 每 条 扫描 线 上 每 4 个 连续 的 采样 点 取 4 个 亮点 样本 入 4 个 色 度 样本 CC 和 4 个 色 度 样 
本 Cu， 这 就 相当 于 每 个 像素 都 用 3 个 分 量 样本 表示 
指 在 每 条 扫描 线 上 每 4 个 连续 的 采样 点 取 4 个 亮点 样本 入 两 个 色 度 样本 Cr 和 两 个 色 度 样 
本 CC。 
指 在 水 平和 垂直 方向 上 每 两 个 连续 的 取样 点 上 取 两 个 亮点 样本 入 一 个 色 度 样本 Ct 和 一 个 
色 度 样本 Co， 即 对 2X2 点 阵 的 4 个 采样 点 采样 4 个 亮度 样本 和 各 一 个 色 度 样 本 。H.261、 
H.263 和 MPEG-1 视频 标准 均 使 用 这 种 取样 格式 
指 在 每 条 扫描 线 上 每 4 个 连续 的 取样 点 取 4 个 亮点 样本 六 一 个 色 度 样本 C; 和 一 个 色 度 样 
本 CC。 


格 式 
4:4:4 格 式 


4:2:2 格 式 


4:2:0 格 式 


4:1:1 格 式 


国际 无 线 电 咨询 委员 会 (International Radio Consultative Committee，CCIR) 制定 的 广播 级 
质量 数字 电视 编码 标准 ， 即 ITU-R BT.601 ( 原 CCIR601) 标准 , 为 PAL、NTSC 和 SECAM 电 
视 制 式 之 间 确 定 了 共同 的 数字 化 参数 。 该 标准 规定 了 彩色 电视 图 像 转换 成 数字 图 像 所 使 用 的 采 
样 频率 、 采 样 结构 和 彩色 空间 转换 等 。 这 个 标准 对 多 媒体 的 开发 和 应 用 十 分 重要 。 

标准 为 PAL、NTSC 和 SECAM 电视 制式 均 使 用 共同 的 电视 图 像 采 样 频率 ， 亮 度 样 本 了 用 
13.5MHz 采样 频率 ， 色 度 样本 C'、Cb 可 以 用 13.5MHz 或 6.75MHz 的 采样 频率 。 

标准 对 于 PAL 和 SECAM 制式 的 亮度 信号 ， 每 一 扫描 行 采 集 864 个 样本 点 ; 而 对 于 NTSC 
制式 的 亮度 信号 ， 每 一 扫描 行 采集 858 个 样本 点 。 对 于 所 有 制式 ， 每 一 扫描 行 的 有 效 样本 点 数 
均 为 720 个 。 
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4. 视频 压缩 编码 


数字 图 像 数据 的 数据 量 大 ， 而 数字 视频 信息 的 数据 量 更 加 突出 。 例 如 ， 每 帧 352X240 像 
素 点 、 图 像 深度 16 位 的 图 像 ， 其 数据 量 为 165kB， 每 秒 30 帧 ， 其 数据 量 就 高 达 4.8MB， 这 么 
大 的 数据 量 无 论 是 传输 、 存 储 还 是 处 理 都 是 极 大 的 负担 。 为 了 解决 这 个 问题 ， 必 须 对 数字 视频 
信息 进行 压缩 编码 处 理 。 

视频 压缩 的 目标 是 在 尽 可 能 保证 视觉 效果 的 前 提 下 减少 视频 数据 量 。 视频 是 连续 的 静态 图 
像 ， 其 单 帧 图 像 压缩 编码 算法 与 静态 图 像 的 压缩 编码 算法 有 共同 之 处 。 但 是 视频 还 有 其 自身 的 
特性 ， 在 压缩 时 必须 考虑 其 运动 特性 ， 即 帧 间 的 元 余 。 由 于 视频 信息 中 各 画面 内 部 有 很 强 的 信 
息 相 关 性 ， 相 邻 帧 又 有 高 度 的 时 间 相 关 性 ， 再 加 上 人 眼 的 视觉 特性 ， 因 此 数字 视频 的 数据 量 可 
压缩 几 十 倍 甚至 几 百 倍 。 视 频 信 息 压 缩编 码 的 方法 很 多 ， 用 户 在 选择 或 设计 视频 压缩 编码 算法 
时 需要 掌握 一 些 视频 压缩 的 基本 概念 。 

(1) 帧 内 压缩 

帧 内 压缩 也 称 为 空间 压缩 ， 仅 考虑 本 帧 的 数据 而 不 考虑 相 邻 帧 之 间 的 宛 余 信息 ， 即 把 单独 
的 图 像 帧 当 作 一 般 静 态 图 像 应 用 静态 图 像 压 缩 算法 实现 数据 压缩 。 如 果 不 考 虑 帧 间 信 息 宛 余 ， 
数字 视频 可 以 采用 每 帧 图 像 都 使 用 帧 内 编码 的 方法 实现 数据 压缩 ， 例 如 M-JPEG 编码 。 仅 采用 
帧 内 压缩 方法 一 般 达 不 到 很 高 的 压缩 比 。 

(2) 帧 间 压 缩 

视频 具有 时 间 上 连续 的 特性 ， 可 以 利用 帧 间 信 息 元 余 ， 即 视频 数据 的 连续 前 后 两 帧 具有 很 
大 的 相关 性 ， 或 者 说 前 后 两 帧 信息 变化 很 小 的 特点 实现 高 效 的 数据 压缩 。 例 如 ， 在 演示 一 个 球 
在 静态 背景 前 滚动 的 视频 片段 中 ， 连 续 两 帧 中 的 大 部 分 图 像 是 基本 不 变 的 〈 背 景 不 变 ) ， 即 连 
续 的 视频 其 相 邻 帧 之 间 具 有 大 量 的 宛 余 信息 。 根 据 这 一 特性 ， 消 除 相 邻 帧 之 间 的 宛 余 信息 就 可 
以 进一步 提高 压缩 比 。 帧 间 压 缩 通常 采用 基于 运动 补偿 的 帧 间 预 测 编码 技术 。 

目前 ， 国 际 标准 化 组 织 制定 的 有 关 视 频 〈 及 其 伴音 ) 压缩 编码 的 几 种 标准 及 其 应 用 范围 如 
表 1-12 所 示 。 


表 1-12 压缩 编码 的 标准 


名 称 源 图 像 格式 压缩 后 的 码 率 主要 应 用 
et CIF 格式 PX64 kbps 应 用 于 视频 通信 ， 例 如 可 视 电 话 、 会 
QCIF 格式 (P=1,2,…,32) 议 电 视 等 
MPEG-1 适用 于 LAN 视频 传输 ，VCD 


MPEG-2 33222887> 1.5~80 Mb DVD, DVB、 HDTV 
i 1920X1152 i i 
MPEG-4 多 种 不 同 的 视频 格式 | 最 低 可 达 64 kbps ”| 虚拟 现实 、 远 程 教育 、 交 互 式 视频 等 
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5. 视频 文件 格式 


常用 的 视频 文件 格式 如 下 。 

(1) Flic 文 件 (.fi、.flc)。Flic 是 Autodesk 公司 在 其 出 品 的 Autodesk Animator、Animator 
Pro、3D Studio 等 2D/3D 动画 制作 软件 中 采用 的 彩色 动画 文件 格式 。 其 中 ，. 伍 是 最 初 的 基于 
320X200 分 辨 率 的 动画 文件 格式 ，.flc 是 .全 的 进一步 扩展 ， 采 用 了 更 高 效 的 数据 压缩 技术 ， 其 
分 辩 率 也 不 再 局 限于 320X200。Flic 文件 采用 行程 编码 (RLE) 算法 和 Delta 算法 进行 无 损 的 
数据 压缩 ， 具 有 较 高 的 数据 压缩 率 。 

(2) AVI 文件 (.avi) 。AVI (Audio Video Interleaved) 是 Microsoft 公司 开发 的 一 种 符合 
RIFF 文件 规范 的 数字 音频 与 视频 文件 格式 ，Windows 操作 系统 直接 支持 。AVI 格式 允许 视频 和 
音频 交错 在 一 起 同步 播放 ，AVI 文件 并 未 限定 压缩 标准 。 因 此 ，AVI 文件 格式 只 是 作为 控制 界 
面 上 的 标准 , 用 不 同 压缩 算法 生成 的 AVI 文件 , 必须 使 用 相同 的 解压 缩 算法 才能 播放 出 来 。AVI 
文件 目前 主要 应 用 在 多 媒体 光盘 上 ， 用 来 保存 电影 、 电 视 等 各 种 影像 信息 ， 有 时 也 出 现在 因 特 
网 上 ， 供 用 户 下 载 、 欣 赏 新 影片 的 片段 。 

(3) Quick Time 文件 (.mov、.qt) 。Qnuick Time 是 Apple 公司 开发 的 一 种 音频 、 视 频 文件 
格式 ， 用 于 保存 音频 和 视频 信息 ， 具 有 先进 的 视频 和 音频 功能 ， 提 供 跨 平 台 支 持 。Quick Time 
支持 RLE、JPEG 等 压缩 技术 ， 目 前 的 Quick Time 进一步 扩展 了 原 有 功能 ， 能 够 通过 Internet 
提供 实时 的 数字 化 信息 流 、 工 作 流 与 文件 回放 功能 。 此 外 ，Qnuick Time 还 采用 了 Quick Time VR 
(QTVR) 技术 的 虚拟 现实 技术 。Quick Time 以 其 领先 的 多 媒体 技术 和 跨 平 台 特 性 、 较 小 的 存储 
空间 要 求 、 技 术 细节 的 独立 性 以 及 系统 的 高 度 开放 性 得 到 了 广泛 的 认可 和 应 用 。 

(4) MPEG 文件 (.mpeg、.mpg、.dat、.mp4) 。MPEG 文件 格式 是 指使 用 MPEG 标准 算 
法 压缩 的 视频 文件 。 在 PC 上 有 统一 的 标准 格式 ， 兼 容 性 相当 好 。.mp4 是 采用 MPEG-4 中 的 视 
频 编 码 技术 进行 视频 编码 的 文件 格式 。 

(5) RealVideo 文件 (.rm、.rmvb) 。RealVideo 文件 是 Real Networks 公司 开发 的 一 种 流 式 
视频 文件 格式 ， 它 包含 在 Real Networks 公司 所 制定 的 音频 视频 压缩 规范 RealMedia 中 ,主要 用 
来 在 低速 率 的 广域网 上 实时 传输 活动 视频 影像 ， 可 以 根据 网 络 数据 传输 速率 的 不 同 采用 不 同 的 
压缩 比率 ， 从 而 实现 影像 数据 的 实时 传输 和 实时 播放 。RealVideo 除了 可 以 以 普通 的 视频 文件 
形式 播放 之 外 ， 还 可 以 与 RealVideo 服务 器 相配 合 ， 实 现 流 式 媒体 传输 。 


1.4.5 ”虚拟 现实 


虚拟 现实 (Virtual Reality，VR) 是 一 项 综合 的 技术 ， 涉 及 计算 机 科学 、 电 子 学 、 心 理学 、 
计算 机 图 形 学 、 人 机 接口 技术 、 传 感 技术 及 人 工 智 能 技术 等 。 它 可 应 用 于 建 模 与 仿真 、 科 学 计 
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算 可 视 化 、 设 计 与 规划 、 教 育 与 训练 、 医 学 、 艺 术 与 娱乐 等 方面 。 这 种 技术 的 特点 在 于 ， 运 用 
计算 机 对 现实 世界 进行 全 面 仿真 ， 创 建 与 现实 类 似 的 环境 ， 通 过 多 种 传 感 设 备 使 用 户 “ 投 入 ” 
到 该 环境 中 ， 实 现 用 户 与 该 环境 直接 进行 自然 交互 。 


1. 虚拟 现实 技术 的 主要 特征 


虚拟 现实 是 将 现实 世界 的 多 维 信息 映射 到 计算 机 的 数字 空间 生成 相应 的 虚拟 世界 ， 主 要 包 
括 基 本 模型 构建 、 空 间 跟踪 、 声 音 定 位 、 视 觉 跟踪 和 视点 感应 等 关键 技术 。 其 主要 特征 有 以 下 
3 个 方面 。 

(1) 多 感知 。 就 是 说 除了 一 般 计算 机 所 具有 的 视觉 感知 外 ， 还 有 听觉 感知 、 力 觉 感知 、 触 
觉 感 知 、 运 动感 知 ， 甚 至 包括 味觉 感知 和 嗅觉 感知 等 。 理 想 的 虚拟 现实 就 是 应 该 具有 人 所 具有 
的 感知 功能 。 

(2) 沉浸 〈 又 称 临场 感 ) 。 沉 浸 是 指 用户 感 到 作为 主角 存在 于 模拟 环境 中 的 真实 程度 。 理 
想 的 模拟 环境 应 该 达到 使 用 户 难以 分 辨 真 假 的 程度 。 

(3) 交 互 。 交 互 是 指 用 户 对 模拟 环境 内 物体 的 可 操作 程度 和 从 环境 得 到 反馈 的 自然 程度 ( 包 
括 实时 性 ) 。 例 如 ， 用 户 可 以 用 手 去 直接 抓 取 环 境 中 的 物体 ， 这 时 手 有 握 着 东西 的 感觉 ， 并 可 
以 感觉 物体 的 重量 ， 视 场 中 的 物体 也 随 着 手 的 移动 而 移动 。 

在 虚拟 环境 中 获取 视觉 、 听 觉 、 力 觉 和 触觉 等 感官 认 知 等 关键 技术 可 以 保证 虚拟 世界 中 的 
事物 所 产生 的 各 种 刺激 以 尽 可 能 自然 的 方式 反馈 给 用 户 。 

(1) 视觉 感知 。 虚 拟 环境 中 大 部 分 具有 一 定形 状 的 物体 或 现象 可 以 通过 多 种 途径 使 用 户 产 
生 真实 感 很 强 的 视觉 感知 。CRT 显示 器 、 大 屏幕 投影 、 多 方位 电子 墙 、 立 体 眼镜 和 头盔 显示 器 
(HMD) 等 是 VR 系统 中 常见 的 显示 设备 。 不 同 的 头盔 显示 器 具有 不 同 的 显示 技术 ， 根 据 光学 
图 像 被 提供 的 方式 ， 头 盔 显 示 设备 可 分 为 投影 式 和 直 视 式 。 

(2) 听觉 感知 。 听 觉 是 仅 次 于 视觉 的 感知 途径 ， 虚 拟 环境 的 声音 效果 ， 可 以 弥补 视觉 效果 
的 不 足 , 增强 环境 逼真 度 。 用 户 所 感受 的 三 维 立体 声音 ， 有 助 于 用 户 在 操作 中 对 声音 进行 定位 。 

(3) 力 觉 和 触觉 感知 。 能 否 让 参与 者 产生 “沉浸 ” 感 的 关键 因素 之 一 是 参与 者 能 否 在 操纵 
虚拟 物体 的 同时 感受 到 虚拟 物体 的 反作用 力 ， 从 而 产生 触觉 和 力 觉 感知 。 例 如 ， 当 用 手 扳 动 虚 
拟 驾驶 系统 的 汽车 挡 位 杆 时 ， 手 能 感觉 到 挡 位 杆 的 震动 和 松紧 。 力 觉 感知 主要 由 计算 机 通过 力 
反馈 手套 、 力 反馈 操纵 杆 对 手指 产生 运动 阻尼 ， 从 而 使 用 户 感受 到 作用 力 的 方向 和 大 小 。 


2. 虚拟 现实 技术 的 分 类 


虚拟 实现 技术 不 仅仅 是 指 那 些 戴 着 头盔 和 手套 等 技术 , 而 且 应 该 包括 一 切 与 之 有 关 的 具有 
自然 模拟 、 逼 真 体验 的 技术 与 方法 ， 它 的 根本 目标 就 是 达到 真实 体验 和 基于 自然 技能 的 人 机 交 
互 。 能 够 达到 或 者 部 分 达到 这 样 目标 的 系统 称 为 虚拟 现实 系统 。 根 据 用 户 参 与 VR 的 不 同形 式 
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以 及 沉浸 的 程度 不 同 ， 可 以 把 各 种 类 型 的 虚拟 现实 技术 大 致 划分 为 4 类 。 

(1) 桌面 虚拟 现实 。 桌 面 虚拟 现实 利用 个 人 计算 机 和 低级 工作 站 进行 仿真 ， 将 计算 机 的 屏 
幕 作为 用 户 观 察 虚拟 境界 的 一 个 窗口 。 通 过 各 种 输入 设备 实现 与 虚拟 现实 世界 的 充分 交互 ， 这 
些 外 部 设备 包括 鼠标 、 追 踪 球 和 力矩 球 等 。 它 要 求 参 与 者 使 用 输入 设备 ， 通 过 计算 机 屏幕 观察 
360" 范 围 内 的 虚拟 境界 ， 并 操纵 其 中 的 物体 ， 但 这 时 参与 者 缺少 完全 的 沉浸 ， 因 为 它 仍然 会 受 
到 周围 现实 环境 的 干扰 。 桌 面 虚拟 现实 的 最 大 特点 是 缺乏 真实 的 现实 体验 ， 但 是 成 本 也 相对 较 
低 , 因而 应 用 比较 广泛 。 常 见 的 桌面 虚拟 现实 技术 有 基于 静态 图 像 的 虚拟 现实 (QuickTime VR)、 
虚拟 现实 造型 语言 (VRML) 、 桌 面 三 维 虚拟 现实 和 MUD 等 。 

(2) 完全 沉浸 的 虚拟 现实 。 高 级 虚拟 现实 系统 提供 完全 沉浸 的 体验 ， 使 用 户 有 一 种 置身 于 
虚拟 境界 之 中 的 感觉 。 它 利用 头盔 式 显示 器 或 其 他 传 感 设 备 把 参与 者 的 视觉 、 听 觉 和 其 他 感觉 
封闭 起 来 ， 并 提供 一 个 新 的 、 虚 拟 的 感觉 空间 ， 利 用 位 置 跟踪 器 、 数 据 手套 、 其 他 手 控 输入 设 
备 和 声音 等 使 参与 者 产生 一 种 身 临 其 境 、 全 心 投 入 和 沉浸 其 中 的 感觉 。 常 见 的 沉浸 式 系统 有 基 
于 头盔 式 显示 器 的 系统 、 投 影 式 虚拟 现实 系统 、 远 程 存在 系统 等 。 

(3) 增强 现实 性 的 虚拟 现实 。 增 强 现实 性 的 虚拟 现实 不 仅仅 是 利用 虚拟 现实 技术 来 模拟 现 
实 世 界 、 仿 真 现实 世界 ， 而 且 要 利用 它 来 增强 参与 者 对 真实 环境 的 感受 ， 也 就 是 增强 现实 中 无 
法 感知 或 不 方便 的 感受 。 
(4) 分 布 式 虚 拟 现实 。 分 布 式 虚拟 现实 系统 是 基于 网 络 的 虚拟 环境 ， 在 这 个 环境 中 ， 位 于 
不 同 物理 环境 位 置 的 多 个 用 户 或 多 个 虚拟 环境 通过 网 络 相连 接 ， 或 者 多 个 用 户 同时 参加 一 个 虚 
拟 现实 环境 ， 通 过 计算 机 与 其 他 用 户 进行 交互 并 共享 信息 。 在 分 布 式 虚拟 现实 系统 中 ， 多 个 用 
户 可 通过 网 络 对 同一 虚拟 世界 进行 观察 和 操作 ， 以 达到 协同 工作 的 目的 。 


程序 设计 语言 是 为 了 书写 计算 机 程序 而 人 为 设计 的 符号 系统 ， 用 于 对 计算 过 程 进行 描述 、 
组 织 和 推导 。 程 序 设计 语言 的 广泛 使 用 始 于 1957 年 出 现 的 Fortran， 目 前 程序 语言 仍然 处 于 不 
断 演化 的 过 程 中 。 


2.1 程序 语言 概述 


本 节 主要 介绍 程序 设计 语言 的 基本 概念 、 基 本 成 分 和 一 些 有 代表 性 的 程序 语言 。 
2.1.1 程序 语言 的 基本 概念 


1， 低 级 语言 和 高 级 语言 


计算 机 的 硬件 只 能 识别 由 0、1 组 成 的 机 器 指令 序列 ， 即 机 器 指令 程序 ， 因 此 机 器 指令 是 
最 基本 的 计算 机 语言 。 由 于 机 器 指令 是 特定 的 计算 机 系统 所 固有 的 、 面 向 机 器 的 语言 ， 所 以 用 
机 器 语言 进行 程序 设计 时 ， 有 较 多 不 便 之 处 ， 如 效率 低 、 程 序 可 读 性 很 差 、 难 以 理解 、 难 以 修 
改 和 维护 等 。 因 此 ， 人 们 就 用 容易 记忆 的 符号 代替 0、1 序列 来 表示 机 器 指令 ， 例 如， 用 ADD 
表示 加 法 、SUB 表示 减法 等 。 用 符号 表示 的 指令 称 为 汇编 指令 ， 汇 编 指 令 的 集合 被 称 为 汇编 语 
言 。 汇 编 语言 与 机 器 语言 十 分 接近 ， 其 格式 在 很 大 程度 上 取决 于 特定 计算 机 的 机 器 指令 ， 因 此 
它 仍然 是 一 种 面向 机 器 的 语言 ， 人 们 称 机 器 语言 和 汇编 语言 为 低级 语言 。 在 此 基础 上 ， 人 们 设 
计 了 功能 更 强 、 抽象 级 别 更 高 的 语言 以 支持 程序 设计 , 于 是 就 产生 了 面向 各 类 应 用 的 程序 语言 ， 
称 为 高 级 语言 。 常 见 的 有 Java、C、C++、C#、Python、PHP、JavaScript 等 。 这 类 语言 与 人 们 
使 用 的 自然 语言 比较 接近 ， 大 大 提高 了 程序 设计 的 效率 。 


2， 编译 程序 和 解释 程序 


高 级 程序 语言 必须 进行 翻译 才能 为 计算 机 硬件 所 理解 ， 语 言 之 间 的 翻译 形式 有 多 种 ， 基 本 
方式 为 汇编 、 解 释 和 编译 。 
某 种 高 级 语言 或 汇编 语言 编写 的 程序 称 为 源 程序 ， 源 程序 不 能 直接 在 计算 机 上 执行 。 如 
果 源 程序 是 用 汇编 语言 编写 的 ， 则 需要 一 个 汇编 程序 将 其 翻译 成 目标 程序 后 才能 执行 。 如 果 源 
程序 是 用 某 种 高 级 语言 编写 的 ， 则 需要 对 应 的 解释 程序 或 编译 程序 对 其 进行 翻译 ， 然 后 在 机 器 
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上 运行 。 

解释 程序 也 称 为 解释 器 ， 它 或 者 直接 解释 执行 源 程序 ， 或 者 将 源 程序 翻译 成 某 种 中 间 代 码 
后 再 加 以 执行 ， 而 编译 程序 〈 编 译 器 ) 则 是 将 源 程序 翻译 成 目标 语言 程序 ， 然 后 在 计算 机 上 运 
行 目标 程序 。 这 两 种 语言 处 理 程序 的 根本 区 别 是 : 在 编译 方式 下 ， 机 器 上 运行 的 是 与 源 程序 等 
价 的 目标 程序 ， 源 程序 和 编译 程序 都 不 再 参与 目标 程序 的 执行 过 程 ;而 在 解释 方式 下 ， 解 释 程 
序 和 源 程序 (或 其 某 种 等 价 表 示 ) 要 参与 到 程序 的 运行 过 程 中 , 运行 程序 的 控制 权 在 解释 程序 。 
简单 来 说 ， 在 解释 方式 下 ， 翻 译 源 程序 时 不 生成 独立 的 目标 程序 ， 而 编译 器 则 将 源 程序 翻译 成 
独立 保存 的 目标 程序 。 

3. 程序 设计 语言 的 定义 

程序 设计 语言 的 定义 涉及 语法 、 语 义 和 语 用 等 方面 。 

语法 是 指 由 程序 语言 的 基本 符号 组 成 程序 中 的 各 个 语言 结构 (包括 程序 ) 的 一 组 规则 ， 其 
中 由 基本 字符 构成 的 符号 (单词 ) 书写 规则 称 为 词法 规则 ， 由 符号 构成 语法 成 分 的 规则 称 为 语 
法 规则 。 程 序 语言 的 语法 可 用 形式 语言 进行 描述 。 

语义 是 程序 语言 中 按 语 法 规则 构成 的 各 个 语法 成 分 的 含义 ， 可 分 为 静态 语义 和 动态 语义 。 
静态 语义 指 编译 时 可 以 确定 的 语法 成 分 的 含义 ， 而 运行 时 才能 确定 的 含义 是 动态 语义 。 一 个 程 
序 的 执行 结果 说 明了 该 程序 的 语义 ， 它 取决 于 构成 程序 的 各 个 组 成 部 分 的 语义 。 

语 用 表示 构成 语言 的 各 个 记号 和 使 用 者 的 关系 ， 涉 及 符号 的 来 源 、 使 用 和 影响 。 语 言 的 实 
现 则 有 个 语 境 问题 。 语 境 是 指 理 解 和 实现 程序 设计 语言 的 环境 ， 包 括 编译 环境 和 运行 环境 。 


4. 程序 设计 语言 的 分 类 


程序 语言 有 交流 算法 和 计算 机 实现 的 双重 目的 ， 现 在 的 程序 语言 种 类 繁多 ， 它 们 在 应 用 上 
各 有 不 同 的 侧重 面 。 若 一 种 程序 语言 不 依赖 于 机 器 硬件 ， 则 称 为 高 级 语言 ， 若 程序 语言 能 够 应 
用 于 范围 广泛 的 问题 求解 领域 ， 则 称 为 通用 的 程序 设计 语言 。 

1) 程序 语言 发 展 概述 

各 种 程序 语言 都 在 不 断 地 发 展 之 中 ,许多 新 的 语言 也 相继 出 现 ， 各 种 开发 工具 在 组 件 化 和 
可 视 化 方面 进展 迅速 。 

Fortran (Formula Translation) 是 第 一 个 被 广泛 用 来 进行 科学 和 工程 计算 的 高 级 语言 。 一 个 
Fortran 程序 由 一 个 主 程序 和 若干 个 子 程序 组 成 。 主 程序 及 每 一 个 子 程序 都 是 独立 的 程序 单位 ， 
称 为 一 个 程序 模块 。 该 语言 自 诞生 以 来 广泛 地 应 用 于 数值 计算 领域 ， 积 累 了 大 量 高 效 而 可 靠 的 
源 程序 。Fortran 语言 的 最 大 特性 是 接近 数学 公式 的 自然 描述 ， 具 有 很 高 的 执行 效率 ， 目 前 广泛 
地 应 用 于 并 行 计算 和 高 性 能 计算 领域 。 
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ALGOL (ALGOrithmic Language) 诞生 于 晶体 管 计算 机 流行 的 年 代 ，ALGOL 60 是 程序 设 
计 语 言 发 展 史 上 的 一 个 里 程 碑 ， 主 导 了 20 世纪 60 年 代 程序 语言 的 发 展 ， 并 为 后 来 软件 自动 化 
及 软件 可 靠 性 的 发 展 葛 定 了 基础 。ALGOL 60 有 严格 的 公式 化 说 明 ,， 即 采用 巴 科 斯 范式 BNF 来 
描述 语言 的 语法 。ALGOL 60 引进 了 许多 新 的 概念 ， 如 局 部 性 概念 、 动 态 、 递 归 等 。 

PASCAL 是 一 种 过 程式 、 结 构 化 程序 设计 语言 ， 由 瑞士 苏黎世 联邦 工业 大 学 的 沃 斯 
(N.Wirth) 教授 设计 ,于 1970 年 发 表 。 该 语言 是 从 ALGOL 60 衍生 的 , 但 功能 更 强 且 容易 使 用 。 
PASCAL 语言 曾经 一 直 在 高 校 计算 机 软件 教学 中 处 于 主导 地 位 ， 其 集成 开发 工具 Turbo Pascal 
曾经 非常 流行 。1985 年 发 布 了 Object Pascal。 

C 语言 是 20 世纪 70 年 代 初 发 展 起 来 的 一 种 通用 程序 设计 语言 ，UNIX 操作 系统 及 其 上 的 
许多 软件 都 是 用 C 编写 的 。 它 兼顾 了 高 级 语言 和 汇编 语言 的 特点 ， 提 供 了 一 个 丰富 的 运算 符 集 
合 以 及 比较 紧凑 的 语句 格式 。 由 于 C 提供 了 高 效 的 执行 语句 并 且 人 允许 程 序 员 直接 访问 操作 系统 
和 底层 硬件 ， 因 此 在 系统 级 应 用 和 实时 处 理应 用 开发 中 成 为 主要 语言 。 

C++ 是 在 C 语言 的 基础 上 于 20 世纪 80 年 代 发 展 起 来 的 , 与 C 兼容 , 但 是 比 C 多 了 封装 和 
抽象 ， 增 加 的 类 机 制 使 C++ 成 为 一 种 面向 对 象 的 程序 设计 语言 。 

C# (C Sharp) 是 由 Microsoft 公司 所 开发 的 一 种 面向 对 象 的 、 运 行 于 .NET Framework 的 高 
级 程序 设计 语言 ， 相 对 于 C++， 这 个 语言 在 许多 方面 进行 了 限制 和 增强 。 

Objective-C 是 根据 C 语言 所 衍生 出 来 的 语言 ， 继 承 了 C 语言 的 特性 ， 是 扩充 C 的 面向 对 
象 的 编程 语言 , 其 与 流行 的 编程 语言 风格 差异 较 大 。 由 于 GCC (GNU Compiler Collection, GNU 
编译 器 套装 ) 含 Objective-C 的 编译 器 ,因此 可 以 在 GCC 运 作 的 系统 中 编写 和 编译 。 该 语言 主要 
Apple 公司 维护 ， 是 MAC 系统 下 的 主要 开发 语言 。 与 C# 类 似 ，Objective-C 仅 支 持 单一 父 类 
继承 ， 不 支持 多 重 继承 。 

Java 产生 于 20 世纪 90 年 代 ， 其 初始 用 途 是 开发 网 络 浏览 器 的 小 应 用 程序 ， 但 是 作为 一 种 
通用 的 程序 设计 语言 ，Java 得 到 非常 广泛 的 应 用 。Java 保留 了 C++ 的 基本 语法 、 类 和 继承 等 概 
念 ， 删 掉 了 C++ 中 一 些 不 好 的 特征 ， 因 此 与 C++ 相 比 ，Java 更 简单 ， 其 语法 和 语义 更 合理 。 
Ruby 是 松本 行 弘 (Yukihiro Matsumoto， 常 称 为 Matz) 大 约 在 1993 年 设计 的 一 种 解释 性 、 
面向 对 象 、 动 态 类 型 的 脚本 语言 。 在 Ruby 语言 中 ， 任 何 东西 都 是 对 象 ， 包 括 其 他 语言 中 的 基 
本 数据 类 型 ， 比 如 整数 ， 每 个 过 程 或 函数 都 是 方法 ， 变 量 没 有 类 型 ， 任 何 东西 都 有 值 〈 不 管 是 
数学 或 者 罗 辑 表达 式 还 是 一 个 语句 ， 都 会 有 值 ) 等 等 。 

PHP (Hypertext Preprocessor) 是 一 种 在 服务 器 端 执行 的 、 舱 入 HTML 文档 的 脚本 语言 ， 
其 语言 风格 类 似 于 C 语言 ， 由 网 站 编程 人 员 广 泛 运用 。PHP 可 以 快速 地 执行 动态 网 页 ， 其 语法 
混合 了 C、Java、Perl 以 及 PHP 自 创 的 语法 。 由 于 在 服务 器 端 执行 ，PHP 能 充分 利用 服务 器 的 
性 能 。 另 外 ，PHP 支持 几乎 所 有 流行 的 数据 库 以 及 操作 系统 。 

Python 是 一 种 面向 对 象 的 解释 型 程序 设计 语言 ， 可 以 用 于 编写 独立 程序 、 快 速 脚本 和 复杂 
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应 用 的 原型 。Python 也 是 一 种 脚本 语言 ， 它 支持 对 操作 系统 的 底层 访问 ， 也 可 以 将 Python 源 程 
序 翻译 成 字 节 码 在 Python 虚拟 机 上 运行 。 虽然 Python 的 内 核 很 小 ， 但 它 提 供 了 丰富 的 基本 构 
建 块 ， 还 可 以 用 C、C++ 和 Java 等 进行 扩展 ， 因 此 可 以 用 它 开 发 任何 类 型 的 程序 。 

JavaScript 是 一 种 脚本 语言 ， 被 广泛 用 于 Web 应 用 开发 ， 常 用 来 为 网 页 添加 各 式 各 样 的 动 
态 功能 ， 为 用 户 提供 更 流畅 美观 的 浏览 效果 。 通 常 ， 将 JavaScript 脚本 嵌入 在 HTML 中 来 实现 
自身 的 功能 。 

Delphi 是 一 种 可 视 化 开发 工具 ,在 Windows 环境 下 使 用 , 其 在 Linux 上 的 对 应 产品 是 Kylix， 
其 主要 特性 为 基于 窗 体 和 面向 对 象 的 方法 、 高 速 的 编译 器 、 强 大 的 数据 库 支 持 、 与 Windows 
编程 紧密 结合 以 及 成 熟 的 组 件 技术 。 它 采用 面向 对 象 的 编程 语言 Object Pascal 和 基于 构件 的 开 

Visual BasicNET 是 基于 微软 .NET Framework 的 面向 对 象 的 编程 语言 。 用 .NET 语言 (包括 
VB.NET) 开发 的 程序 源 代码 不 是 直接 编译 成 能 够 直接 在 操作 系统 上 执行 的 二 进 制 本 地 代码 ， 
而 是 被 编译 成 为 中 间 代 码 MSIL (Microsoft Intermediate Language)， 然 后 通过 .NET Framework 
的 通用 语言 运行 时 《CLR) 来 执行 。 程 序 执行 时 ，.Net Framework 将 中 间 代 码 翻译 成 为 二 进 制 
机 器 码 后 ， 使 它 得 以 运行 。 因 此 ， 如 果 计 算 机 上 没有 安装 .Net Framework， 这 些 程序 将 不 能 够 
被 执行 。 

2) 程序 语言 的 分 类 

程序 语言 的 分 类 没有 统一 的 标准 , 这 里 根据 设计 程序 的 方法 将 程序 语言 大 致 分 为 命令 式 和 
结构 化 程序 设计 语言 、 面 向 对 象 的 程序 设计 语言 、 函 数 式 程序 设计 语言 和 逻辑 型 程序 设计 语言 

(1) 命令 式 程序 设计 语言 。 命 令 式 语言 是 基于 动作 的 语言 ， 在 这 种 语言 中 ， 计 算 被 看 成 是 
动作 的 序列 。 命 令 式 语言 族 开 始 于 Fortran, PASCAL 和 C 语言 都 可 以 体现 命令 式 程序 设计 的 关 
键 思想 。 
通常 所 称 的 结构 化 程序 设计 语言 属于 命令 式 语言 类 ， 其 结构 特性 主要 反映 在 以 下 几 个 方 
面 : 一 是 用 自 顶 向 下 逐步 精 化 的 方法 编程 ,二 是 按 模块 组 织 的 方法 编程 ， 三 是 程序 只 包含 顺序 、 
判定 〈 分 支 ) 及 循环 构造 ， 而 且 每 种 构造 只 允许 单 入口 和 单 出 口 。 结 构 化 程序 的 结构 简单 清晰 、 
模块 化 强 ， 描 述 方式 接近 人 们 习惯 的 推理 式 思维 方式 ， 因 此 可 读 性 强 ， 在 软件 重用 性 、 软 件 维 
护 等 方面 都 有 所 进步 ， 在 大 型 软件 开发 中 曾 发 挥 过 重要 的 作用 。 目 前 仍 有 许多 应 用 程序 的 开发 
采用 结构 化 程序 设计 技术 和 方法 。C、PASCAL 等 都 是 典型 的 结构 化 程序 设计 语言 。 

(2) 面向 对 象 的 程序 设计 语言 。 程 序 设计 语言 的 演化 从 最 开始 的 机 器 语言 到 汇编 语言 到 各 
种 结构 化 高 级 语言 ， 最 后 到 支持 面向 对 象 技术 的 面向 对 象 语言 ， 反 映 的 就 是 一 条 抽象 机 制 不 断 
提高 的 演化 道路 。 
面向 对 象 的 程序 设计 在 很 大 程度 上 应 归功 于 从 模拟 领域 发 展 起 来 的 Simula, 其 提出 了 对 象 
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和 类 的 概念 。C++、Java 和 Smalltalk 是 面向 对 象 程 序 设计 语言 的 代表 ， 它 们 都 必须 支持 新 的 程 
序 设 计 技 术 ， 如 数据 隐藏 、 数 据 抽象 、 用 户 定义 类 型 、 继 承 和 多 态 等 。 

(3) 函数 式 程序 设计 语言 。 函 数 式 语言 是 一 类 以 入 -演算 为 基础 的 语言 ， 其 基本 概念 来 自 于 
LISP， 这 是 一 个 在 1958 年 为 了 人 工 智 能 应 用 而 设计 的 语言 。 函 数 是 一 种 对 应 规则 映射 )， 它 
使 定义 域 中 每 个 元 素 和 值 域 中 唯一 的 元 素 相对 应 。 


函数 定义 1: Square[x]:=x*x 
函数 定义 2: Plustwo[x]:=Plusone[Plusone[x 


] 


函数 定义 3: fact[n]:=if n=0 then 1 else nxfact[n-1] 
在 函数 定义 2 中， 使 用 了 函数 复合 ， 即 将 一 个 函数 调用 嵌 套 在 另 一 个 函数 定义 中 。 在 函数 
定义 3 中 ， 函 数 被 递归 定义 。 由 此 可 见 ， 函 数 可 以 看 成 是 一 种 程序 ， 其 输入 就 是 定义 中 左边 括 


号 中 的 量 。 它 也 可 将 输入 组 合 起 来 产生 一 个 规则 


， 组 合 过 程 中 可 以 使 用 其 他 函数 或 该 函数 本 身 。 


这 种 用 函数 和 表达 式 建立 程序 的 方法 就 是 函数 式 程序 设计 。 函 数 型 程序 设计 语言 的 优点 之 一 就 
是 对 表达 式 中 出 现 的 任何 函数 都 可 以 用 其 他 函数 来 代替 ， 只 要 这 些 函 数 调用 产生 相同 的 值 。 


函数 式 语言 的 代表 LISP 在 许多 方面 与 其 他 语言 不 同 ， 其 中 最 为 显著 的 是 ， 其 程序 和 数据 
的 形式 是 等 价 的， 这 样 数据 结构 就 可 以 作为 程序 执行 ， 程 序 也 可 以 作为 数据 修改 。 在 LISP 中 ， 
大 量 地 使 用 递归 。 常 见 的 函数 式 语言 有 Haskell、 


Scala、Scheme、APL 等 。 


(4) 多 辑 型 程序 设计 语言 。 逻 辑 型 语言 是 一 类 以 形式 逻辑 为 基础 的 语言 ， 其 代表 是 建立 在 
关系 理论 和 一 阶 谓词 理论 基础 上 的 PROLOG。PROLOG 代表 Programming in Logic。PROLOG 
程序 是 一 系列 事实 、 数 据 对 象 或 事实 间 的 具体 关系 和 规则 的 集合 。 通 过 查询 操作 把 事实 和 规则 


输入 数据 库 。 用 户 通过 输入 查询 来 执行 程序 。 在 PROLOG 中 ， 关 键 操作 是 模式 匹配 ， 通 过 匹 


配 一 组 变量 与 一 个 预先 定义 的 模式 并 将 该 组 变量 赋 给 该 模式 来 完成 操作 。 以 值 集合 S 和 7T 上 的 


二 元 关系 为 例 ，R 实现 后 ， 可 以 询问 : 
@ 已 知 a 和 4b， 确 定 R(a,b) 是 否 成 立 。 
@ 已 知 a， 求 所 有 使 RCay) 成 立 的 y。 
@ 已 知 b5， 求 所 有 使 R(x,b) 成 立 的 x。 
图 求 所 有 使 R(xy) 成 立 的 x 和 y。 


逻辑 型 程序 设计 具有 与 传统 的 命令 型 程序 设计 完全 不 同 的 风格 ,。 PROLOG 数据 库 中 的 事实 


和 规则 是 形式 为 “P:-P!|，P，,，…，P,” 的 Hore 

的 断言 ，R; 是 关系 名 。 该 子 句 表示 规则 : 若 P,， 

时 ，Hore 子 句 变 成 P， 这 样 的 子 句 称 为 事实 。 
一 旦 有 了 事实 与 规则 后 ， 就 可 以 提出 询问 。 


子 句 ， 其 中 1 过 0，P (1i<n) 为 形 如 RX(…) 
P2，…，P, 均 为 真 (成立)， 则 P 为 真 。 当 n=0 


测试 用 户 询问 A 是 否 成 立时 ， 采 用 归结 方法 。 


@ 如 果 程序 中 包含 事实 P， 且 P 和 A 匹配 ， 则 A 成 立 。 


@ 如 果 程序 中 包含 Hore 子 句 “P:-P1, P;， 


…，P,”， 且 P 和 A 匹配 ， 则 PROLOG 转 而 测 
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试 P，P2，…，P,。 只 有 当 Pi，P2，…， 了 ,都 成 立时 才能 断言 P 成 立 。 当 求解 某 个 P; 失 败 时 ， 
则 返回 到 前 面 的 某 个 成 功 点 并 尝试 另 一 种 选择 ， 也 就 是 进行 回溯 。 
@ 只 有 当 所 有 可 能 情况 都 已 穷尽 时 ， 才 能 推导 出 P 失败 。 
PROLOG 有 很 强 的 推理 功能 ， 适 用 于 书写 自动 定理 证 明 、 专 家 系统 和 自然 语言 理解 等 问题 
的 程序 。 
2.1.2 程序 语言 的 基本 成 分 

程序 语言 的 基本 成 分 包 插 数据、 运算、 控制 和 传输 。 

1. 程序 语言 的 数据 成 分 


程序 语言 的 数据 成 分 指 其 程序 中 的 数据 对 象 . 数据 对 象 总 是 对 应 着 应 用 系统 中 某 些 有 意义 
的 东西 ， 数 据 表示 则 指示 了 程序 中 值 的 组 织 形式 。 数 据 类 型 用 于 描述 数据 对 象 ， 还 用 于 在 基础 
机 器 中 完成 对 值 的 布局 ， 同 时 还 可 用 于 检查 表达 式 中 对 运算 的 应 用 是 否 正确 。 
数据 是 程序 操作 的 对 象 ， 具 有 存储 类 别 、 类 型 、 名 称 、 作 用 域 和 生存 期 等 属性 ， 使 用 时 要 
为 它 分 配 内 存 空 间 。 数 据 名 称 由 用 户 通过 标识 符 命名 ， 在 一 些 语言 中 ， 标 识 符 是 由 字母 、 数 字 
和 下 画 线 “_” 组 成 的 标记 ; 类 型 说 明 数 据 占 用 内 存 的 大 小 和 存放 形式 ， 存 储 类 别 说 明 数 据 在 
内 存 中 的 位 置 和 生存 期 ， 作 用 域 则 说 明 可 以 使 用 数据 的 代码 范围 ， 生存 期 说 明 数 据 占用 内 存 的 
时 间 范 围 。 从 不 同 角 度 可 将 数据 进行 不 同 的 划分 。 
1) 常量 和 变量 
按照 程序 运行 时 数据 的 值 能 否 改 变 ， 将 程序 中 的 数据 分 为 常量 和 变量 。 程 序 中 的 数据 对 象 
可 以 具有 左 值 和 《或 ) 右 值 ， 左 值 指 存储 单元 〈 或 地 址 、 容 器 )， 右 值 是 值 (或 内 容 )。 变 量具 
有 左 值 和 右 值 ， 在 程序 运行 过 程 中 其 右 值 可 以 改变 ;常量 只 有 右 值 ， 在 程序 运行 过 程 中 其 右 值 
不 能 改变 。 

2) 全 局 变量 和 局 部 变量 

按 数 据 的 作用 域 范围 ， 可 分 为 全 局 量 和 局 部 量 。 系 统 为 全 局 变量 分 配 的 存储 空间 在 程序 运 
行 的 过 程 中 一 般 是 不 改变 的 ， 而 为 局 部 变量 分 配 的 存储 单元 是 可 以 动态 改变 的 。 

3) 数据 类 型 

按照 数据 组 织 形 式 的 不 同 可 将 数据 分 为 基本 类 型 、 用 户 定 义 类 型 、 构 造 类 型 及 其 他 类 型 。 
以 C/C++ 为 例 ， 其 数据 类 型 如 下 。 

(1) 基本 类 型 : 整 型 (int)、 字 符 型 (char)、 实 型 (float、double》 和 布尔 类 型 (bool)。 

(2) 特殊 类 型 : 空 类 型 (void)。 

(3) 用 户 定义 类 型 : 枚 举 类 型 (enum )。 

(4) 构造 类 型 : 数组 、 结 构 、 联 合 。 
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(5) 指针 类 型 : type *。 

(6) 抽象 数据 类 型 : 类 类 型 。 

其 中 ， 布 尔 类 型 和 类 类 型 由 C++ 语言 提供 。 
2， 程序 语言 的 运算 成 分 


程序 语言 的 运算 成 分 指明 允许 使 用 的 运算 符号 及 运算 规则 。 大 多 数 高 级 程序 语言 的 基本 运 
算 可 以 分 成 算术 运算 、 关 系 运算 和 风 辑 运算 等 ， 有 些 语言 如 C/C++ 还 提供 位 运算 。 运 算 符号 的 
使 用 与 数据 类 型 密切 相关 。 为 了 明确 运算 结果 ， 运 算 符号 要 规定 优先 级 和 结合 性 ， 必 要 时 还 要 
使 用 圆 括号 。 


3. 程序 语言 的 控制 成 分 


控制 成 分 指明 语言 允许 表述 的 控制 结构 ， 程 序 员 使 用 控制 成 分 来 构造 程序 中 的 控制 逻辑 。 
E 论 上 已 经 证 明 ， 可 计算 问题 的 程序 都 可 以 用 顺序 、 选 择 和 循环 这 三 种 控制 结构 来 描述 。 
1) 顺序 结构 
顺序 结构 用 来 表示 一 个 计算 操作 序列 。 计 算 过 程 从 所 描述 的 第 一 个 操作 开始 ， 按 顺序 依次 
执行 后 续 的 操作 ， 直 到 序列 的 最 后 一 个 操作 ， 如 图 2-1 所 示 。 顺 序 结构 内 也 可 以 包含 其 他 控制 
结构 。 
2) 选择 结构 
选择 结构 提供 了 在 两 种 或 多 种 分 支 中 选择 其 中 一 个 的 逻辑 。 基 本 的 选择 结构 是 指定 一 个 条 
件 P, 然后 根据 条 件 的 成 立 与 否决 定 控制 流 走 计算 A 还 是 计算 B， 从 两 个 分 支 中 选择 一 个 执行 。 
如 图 2-2(a) 所 示 。 选 择 结构 中 的 计算 A 或 计算 B 还 可 以 包含 顺序 、 选 择 和 重复 结构 。 程 序 语 
言 中 通常 还 提供 简化 了 的 选择 结构 ， 也 就 是 没有 计算 B 的 分 支 结构 ， 如 图 2-2 (b) 所 示 。 


不 成 立 〈 假 ) a 不 成 立 ( 假 ) 


一 条件? 全 一 条件? 一 
真 ) 


A A 


(a) 分 支 结 构 1 (b) 分 支 结构 2 
图 2-1 顺序 结构 示意 图 图 2-2 选择 结构 示意 图 


es! 


| 


= /obs w= | 
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3) 循环 结构 

循环 结构 描述 了 重复 计算 的 过 程 ， 通 常 由 三 部 分 组 成 : 初始 化 、 循 环 体 和 循环 条 件 ， 其 中 
初始 化 部 分 有 时 在 控制 的 逻辑 结构 中 不 进行 显 式 的 表示 。 循 环 结构 主要 有 两 种 形式 : while 型 
循环 结构 和 do-while 型 循环 结构 。while 型 结构 的 逻辑 含义 是 先 判断 条 件 P,， 若 成 立 则 执行 循环 
体 A， 然 后 再 去 判断 条 件 P; 否则 控制 流 就 退出 循环 结构 ， 如 图 2-3 (a) 所 示 。do-while 型 结 
构 的 逻辑 含义 是 先 执行 循环 体 A, 然后 再 判断 条 件 P, 若 成 立 则 继续 执行 A 的 过 程 并 判断 条 件 ; 
否则 控制 流 就 退出 循环 结构 ， 如 图 2-3 (b) 所 示 。 


一 


成 立 ( 真 ) A ( 假 ) 
条 件 P 
成 立 ( 真 ) 


(a) while 循环 结构 (b) do-while 循环 结构 


2-3 ”循环 结构 示意 图 


4) C/C++ 语言 中 的 控制 语句 

(1) 复合 语句 。 复 合 语句 用 于 描述 顺序 结构 。 复 合 语句 是 一 系列 用 “{ ”和 “}” 括 起 来 的 
声明 和 语句 ， 其 主要 作用 是 将 多 条 语句 组 成 一 个 可 执行 单元 。 语 法 上 能 出 现 语句 的 地 方 都 可 以 
使 用 复合 语句 。 复 合 语句 是 一 个 整体 ， 要 么 全 部 执行 ， 要 么 一 条 语句 也 不 执行 。 

(2) 让 语句 和 switch 语句 。 

@ 站 语句 实现 的 是 双 分 支 的 选择 结构 ， 其 一 般 形 式 为 : 


让 (表达 式 ) 语句 1;else 语句 2; 

其 中 , 语句 1 和 语句 2 可 以 是 任何 合法 的 C/C++ 语句 , 当 语 句 2 为 空 语句 时 , 可 以 简化 为 : 
让 (表达 式 ) 语句 1; 

使 用 让 语句 时 ， 需 要 注意 让 和 else 的 匹配 关系 。C/C++ 语 言 规 定 ，else 总 是 与 离 它 最 近 的 


尚 没有 else 的 让 相 匹 配 。 
@ switch 语句 描述 了 多 分 支 的 选择 结构 ， 其 一 般 形 式 为 : 
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switch (表达 式 ) { 
case 常量 表达 式 1: 语句 1; 
case 常量 表达 式 2: 语句 2; 


击 放 常量 表达 式 n: 语句 m; 
default: 语句 n+l; 
} 
执行 switch 语句 时 ， 首 先 计算 表达 式 的 值 ， 然 后 用 所 得 的 值 与 列举 的 常量 表达 式 值 依次 比 
较 ， 若 任 一 常量 表达 式 都 不 能 与 所 得 的 值 相 匹 配 ， 则 执行 default 的 “语句 n+1”， 然 后 结束 switch 
语句 。 若 表达 式 的 值 与 常量 表达 式 i(i=1,2,…,n) 的 值 相同 ， 则 执行 “语句 序 i”， 当 case i 的 语句 
i 中 无 break 语句 时 ， 则 执行 随后 的 语句 it1， 语 名 计 2，…… 直到 执行 完 语句 n+l 后 ， 才 退出 
switch 语句 ; 或 者 遇 到 break 时 跳出 switch 语句 。 要 使 得 程序 在 执行 “语句 记 后 结束 整个 switch 
语句 ， 则 语句 i 中 应 包含 控制 流 能 够 到 达 的 break 语句 。 
常量 表达 式 通常 为 字符 型 或 整 型 。 多 个 常量 表达 式 可 以 共用 一 个 语句 组 。 
(3) 循环 语句 。C/C++ 语 言 中 有 while、do-while 和 for 三 种 循环 语句 ， 用 于 描述 循环 计算 
的 控制 结构 。 
Q@ while 语句 。while 语句 描述 了 先 判断 条 件 再 执行 循环 体 的 控制 结构 ， 其 一 般 形式 是 : 
while (条 件 表达 式 ) 循环 体 语句; 
其 中 ， 循 环 体 语 句 多 于 一 条 时 ， 应 使 用 “{ ”和 “}” 插 起 来 。 执 行 while 语句 时 ， 先 计算 
条 件 表达 式 的 值 ， 当 值 为 非 0 时 ， 就 执行 循环 体 语句 ， 然 后 重新 计算 条 件 表达 式 的 值 后 再 进行 
判断 ， 否 则 就 结束 while 语句 的 执行 过 程 。 
@ do-while 语句 。do-while 语句 描述 了 先 执行 循环 体 再 判断 条 件 的 控制 结构 ， 其 一 般 格 
式 是 : 


do 


循环 体 语句 ; 
while (条 件 表 达 式 ); 


执行 do-while 语句 时 ， 先 执行 其 循环 体 语句 ， 然 后 再 计算 条 件 表 达 式 的 值 ， 若 值 为 非 0， 
则 再 一 次 地 执行 循环 体 语句 ， 计 算 条 件 表 达 式 并 进行 判断 ， 直 到 条 件 表达 式 的 值 为 0 时 ， 才 结 
束 do-while 语句 的 执行 过 程 。 

@ for 语句。for 语句 的 基本 格式 是 : 

for( 表 达 式 1; 表 达 式 2; 表 达 式 3) 循环 体 语 句 ; 

可 用 while 语句 等 价 地 表示 为 : 
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表达 式 1; 
while( 表 达 式 2){ 
循环 体 语句 ; 
表达 式 3; 
} 


for 语句 的 使 用 是 很 灵活 的 ， 其 内 部 的 三 个 表达 式 都 可 以 省 略 ， 但 用 于 分 隔 三 个 表达 式 的 
分 号 “;” 不 能 遗漏 。 

C/C++ 语言 中 还 有 实现 控制 流 跳 转 的 goto、break 和 continue 语句 ， 由 于 使 用 goto 有 可 能 
导致 程序 的 逻辑 结构 不 够 清晰 ， 因 此 不 提倡 使 用 。 

程序 语言 的 传输 成 分 指明 语言 允许 的 数据 传输 方式 ， 如 赋值 处 理 、 数 据 的 输入 和 输出 等 。 


4. 函数 


函数 是 程序 模块 的 主要 成 分 ， 它 是 一 段 具有 独立 功能 的 程序 代码 。C 程序 由 一 个 或 多 个 函 
数组 成 ， 每 个 函数 都 有 一 个 名 字 ， 其 中 有 且 仅 有 一 个 名 字 为 main 的 函数 ， 作 为 程序 运行 时 的 
起 点 。 函 数 的 使 用 涉及 三 个 概念 : 函数 定义 、 函 数 声明 和 函数 调用 。 

1) 函数 定义 

函数 的 定义 包括 两 部 分 : 函数 首部 和 函数 体 。 函 数 的 定义 描述 了 函数 做 什么 和 怎么 做 。 函 
数 定义 的 一 般 格式 是 : 

返回 值 的 类 型 ”函数 名 (形式 参数 表 ) /函数 首部 

{ 


函数 体 ; 

} 

函数 首部 说 明了 函数 返回 值 的 数据 类 型 、 函 数 的 名 字 和 函数 运行 时 所 需 的 参数 及 类 型 。 函 
数 所 实现 的 功能 在 函数 体 部 分 进行 描述 。 

C/C++ 程序 中 所 有 函数 的 定义 都 是 独立 的 .在 一 个 函数 的 定义 中 不 允许 定义 另外 一 个 函数 ， 
也 就 是 不 允许 函数 的 媒 套 定义 。 

2) 函数 声明 

对 于 函数 ， 应 该 先 声明 后 引用 。 如 果 程 序 中 对 一 个 函数 的 调用 在 该 函数 的 定义 之 前 进行 ， 
则 应 该 在 调用 前 对 被 调用 函数 进行 声明 。 函 数 原型 用 于 声明 函数 。 函 数 声明 的 一 般 形 式 为 : 

返回 值 类 型 函数 名 (参数 类 型 表 ); 
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使 用 函数 原型 的 目的 是 告诉 编译 器 传递 给 函数 的 参数 个 数 、 类 型 以 及 函数 返回 值 的 类 型 ， 
参数 表 中 仅 需 要 依次 列 出 函数 定义 时 参数 的 类 型 ， 以 使 编译 器 能 更 彻底 地 检查 源 程序 中 对 函数 
的 调用 是 否 合适 。 

3) 函数 调用 

当 在 一 个 函数 〈 称 为 主 调 函数 ) 中 需要 使 用 另 一 个 函数 〈 称 为 被 调 函数 ) 实现 的 功能 时 ， 
便 以 名 字 进 行 调用 ， 称 为 函数 调用 。 在 使 用 一 个 函数 时 ， 只 要 知道 如 何 调用 就 可 以 了 ， 并 不 需 
要 了 解 被 调用 函数 的 内 部 实现 。 因 此 ， 主 调 函 数 需 要 知道 被 调 函 数 的 名 字 、 返 回 值 和 需要 向 被 
调 函数 传递 的 参数 〈 个 数 、 类 型 、 顺 序 ) 等 信息 。 

函数 调用 的 一 般 形式 为 : 

函数 名 ( 实 参 表 ); 

在 C 程序 的 执行 过 程 中 , 通过 函数 调用 实现 了 函数 定义 时 描述 的 功能 。 函 数 体 中 若 调用 自 
己 ， 则 称 为 递归 调用 。 

调用 函数 和 被 调用 函数 之 间 交 换 信 息 的 方法 主要 有 两 种 : 一 种 是 由 被 调用 函数 把 返回 值 返 
回 给 主 调 函 数 ， 另 一 种 是 通过 参数 带 回信 息 。 函 数 调用 时 实 参与 形 参 间 交 换 信 息 的 方法 有 值 调 
用 和 引用 调用 两 种 。 

(1) 值 调用 (Call by Value)。 若 实现 函数 调用 时 实 参 向 形式 参数 传递 相应 类 型 的 值 (副本 )， 
则 称 为 是 传 值 调用 。 这 种 方式 下 形 参 不 能 向 实 参 传递 信息 。 

在 C 语言 中 ， 要 实现 被 调用 函数 对 实 参 的 修改 ， 必 须 用 指针 作 形 参 。 即 调用 时 需要 先 对 实 
参 进 行 取 地 址 运算 ， 然 后 将 实 参 的 地 址 传递 给 指针 形 参 。 本 质 上 仍 属于 值 调 用 。 这 种 方式 实现 
了 间接 内 存 访问 。 

(2) 引用 调用 (Call by Reference)。 引 用 是 C++ 中 增加 的 数据 类 型 ， 当 形式 参数 为 引用 类 
型 时 ， 形 参 名 实际 上 是 实 参 的 别名 ， 函 数 中 对 形 参 的 访问 和 修改 实际 上 就 是 针对 相应 实际 参数 
所 做 的 访问 和 改变 。 例 如 : 

void swap(int &x, int &y) 。 《{ 。 /* 交 换 x 和 y*/ 

int temp; 
temp=x; x=y; y=temp; 


} 

函数 调用 : swap(a,b);。 

在 实现 调用 swap(a,b) 时 ，x、y 就 是 a、b 的 别名 ， 因 此 ， 函 数 调用 完成 后 ， 交 换 了 a 和 b 
的 值 。 
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2.2 程序 语言 翻译 基础 


语言 翻译 程序 是 一 类 系统 软件 的 总 称 ， 其 主要 作用 是 将 高 级 语言 或 汇编 语言 编写 的 程序 翻 
译 成 某 种 机 器 语言 程序 ， 使 程序 可 在 计算 机 上 运行 。 语 言 处 理 程序 主要 分 为 汇编 程序 、 编 译 程 
序 和 解释 程序 三 种 基本 类 型 。 


2.2.1 汇编 程序 基本 原理 


1， 汇 编 语言 


汇编 语言 是 为 特定 的 计算 机 或 计算 机 系统 设计 的 面向 机 器 的 符号 化 程序 设计 语言 。 用 汇编 
语言 编写 的 程序 称 为 汇编 语言 源 程序 。 因 为 计算 机 不 能 直接 识别 和 运行 符号 语言 程序 ， 所 以 要 
用 专门 的 翻译 程序 一 汇编 程序 进行 翻译 。 用 汇编 语言 编写 程序 要 遵循 所 用 语言 的 规范 和 
约定 。 

汇编 语言 源 程序 由 若干 条 语句 组 成 ， 一 个 程序 中 可 以 有 三 类 语句 指令 语句 、 伪 指令 语句 
和 宏 指 令 语 句 。 

(1) 指令 语句 。 指 令 语句 又 称 为 机 器 指令 语句 ， 将 其 汇编 后 能 产生 相应 的 机 器 代码 ， 这 些 
代码 能 被 CPU 直接 识别 并 执行 相应 的 操作 。 常 见 的 基本 指令 如 ADD、SUB 和 AND 等 ， 书 写 
指令 语句 时 必须 遵循 指令 的 格式 要 求 。 

指令 语句 可 分 为 传送 指令 、 算 术 运 算 指令 、 逻 辑 运 算 指令 、 移 位 指令 、 转 移 指 令 和 处 理 机 
控制 指令 等 类 型 。 

(2) 伪 指 令 语句 。 伪 指令 语句 指示 汇编 程序 在 汇编 源 程序 时 完成 某 些 工作 ， 例 如 给 变量 分 
配 存 储 单元 地 址 ， 给 某 个 符号 赋值 等 。 伪 指令 语句 与 指令 语句 的 区 别 是 : 伪 指 令 语句 经 汇编 后 
不 产生 机 器 代码 ， 而 指令 语句 经 汇编 后 要 产生 相应 的 机 器 代码 。 另 外 ， 伪 指令 语句 所 指示 的 操 
作 是 在 源 程序 被 汇编 时 完成 的 ， 而 指令 语句 对 应 的 操作 必须 在 程序 运行 时 完成 。 

(3) 宏 指 令 语句 。 在 汇编 语言 中 ， 还 允许 用 户 将 多 次 重复 使 用 的 程序 段 定 义 为 宏 。 宏 的 定 
义 必 须 按照 相应 的 规定 进行 ， 每 个 宏 都 有 相应 的 宏 名 。 在 程序 的 任意 位 置 ， 若 需要 使 用 这 段 程 
序 , 只 要 在 相应 的 位 置 使 用 宏 名 ， 即 相当 于 使 用 了 这 段 程序 。 因 此 ， 宏 指令 语句 就 是 宏 的 引用 。 


2， 汇编 程序 


汇编 程序 的 功能 是 将 汇编 语言 所 编写 的 源 程序 翻译 成 机 器 指令 程序 。 汇 编程 序 的 基本 工作 
包括 将 每 一 条 可 执行 汇编 语句 转换 成 对 应 的 机 器 指令 ;处 理 源 程序 中 出 现 的 伪 指 令 。 由 于 汇编 


国 ss 大 。 歼 据 库 系统 工程 是 教程 (第 3 版 ) 


指令 


形成 操作 数 地 址 的 部 分 可 能 出 现 后 面 才 会 有 定义 的 符号 ， 所 以 汇编 程序 一 般 需 要 两 次 扫 


描 源 程序 才能 完成 翻译 过 程 。 

第 一 次 扫描 的 主要 工作 是 定义 符号 的 值 并 创建 一 个 符号 表 ST，ST 记录 了 汇编 时 所 遇 到 的 
符号 的 值 。 另 外 ， 有 一 个 固定 的 机 器 指令 表 MOT 1 ， 其 中 记录 了 每 条 机 器 指令 的 记忆 码 和 指 
令 的 长 度 。 在 汇编 程序 翻译 源 程序 的 过 程 中 ， 为 了 计算 各 汇编 语句 标号 的 地 址 ， 需 要 设立 一 个 
位 置 计数 器 或 单元 地 址 计数 器 LC 〈Location Counter)， 其 初 值 一 般 为 0。 在 扫描 源 程序 时 ， 每 
处 理 完 一 条 机 器 指令 或 与 存储 分 配 有 关 的 伪 指 令 〈 如 定义 常数 语句 、 定 义 储存 语句 )，LC 的 值 
就 增加 相应 的 长 度 。 这 样 ， 在 汇编 过 程 中 ，LC 的 内 容 就 是 下 一 条 被 汇编 的 指令 的 偏 移 地 址 。 
若 正在 汇编 的 语句 是 有 标号 的 ， 则 该 标号 的 值 就 取 LC 的 当前 值 。 

此 外 ， 在 第 一 次 扫描 中 ， 还 需要 对 与 定义 符号 值 有 关 的 伪 指令 进行 处 理 。 为 了 叙述 方便 ， 
不 妨 设立 伪 指 令 表 POT1。POTI1 表 的 每 一 个 元 素 只 有 两 个 域 : 伪 指 令 助 记 符 和 相应 的 子 程序 入 


口 。 


下 


面 的 步骤 〈1) 一 〈5) 描述 了 汇编 程序 第 一 次 扫描 源 程序 的 过 程 。 


(1) 单元 计数 器 LC 置 初 值 0; 

(2) 打开 源 程序 文件 ; 

(3) 从 源 程序 中 读 入 第 一 条 语句 ; 

(4) while ( 若 当前 语句 不 是 END 语句 ) { 


这 当前 语句 有 标号 ) 则 将 标号 和 单元 计数 器 LC 的 当前 值 填 入 符号 表 ST; 

这 当前 语句 是 可 执行 的 汇编 指令 语句 ) 则 查找 MOT1 表 获 得 当前 指令 的 长 度 K， 并 令 
LC=LC+K; 

这 当前 指令 是 伪 指 令 ) 则 查找 POT1 表 并 调用 相应 的 子 程序 ; 

这 当前 指令 的 操作 码 是 非法 记忆 码 ) 则 调用 出 错 处 理子 程序 ; 

从 源 程 序 中 读 入 下 一 条 语句 ; 

} 


(5) 关闭 源 程序 文件 。 


第 二 次 扫描 的 任务 是 产生 目标 程序 。 除 了 使 用 前 一 次 扫描 所 生成 的 符号 表 ST 外 ， 还 要 使 


用 机 器 指令 表 MOT2， 该 表 中 有 机 器 指令 助 记 符 、 机 器 指令 的 二 进 制 操作 码 (Binary-code)、 格 


式 〈Type) 和 长 度 (Length) 等 。 此 外 ， 还 要 设立 一 个 伪 指 令 表 POT2， 供 第 二 次 扫描 时 使 用 。 


POT2 的 每 一 元 素 仍 有 两 个 域 : 伪 指 令 记忆 码 和 相应 的 子 程序 入 口 。 与 第 一 次 扫描 的 不 同 之 处 


是 : 在 第 二 次 扫描 中 ， 伪 指令 有 着 完全 不 同 的 处 理 。 


表 来 实现 ;二 是 求 出 操作 数 区 各 操作 数 的 值 (用 二 进 制 表示 )。 在 此 基础 上 ， 就 可 以 装配 出 用 


在 第 二 次 扫描 中 ， 可 执行 汇编 语句 应 被 翻译 成 对 应 的 二 进 制 代 码 机 器 指令 。 这 一 过 程 涉及 
两 个 方面 的 工作 : 一 是 把 机 器 指令 助 记 符 转 换 成 二 进 制 机 器 指令 操作 码 ， 这 可 通过 查找 MOT2 
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二 进 制 代码 表示 的 机 器 指令 。 从 求 值 的 角度 看 ， 第 二 部 分 工作 并 不 复杂 。 由 于 形成 操作 数 地 址 
的 各 个 部 分 都 以 表达 式 的 形式 出 现 ， 只 要 定义 一 个 过 程 eval-expr(index,value)， 其 功能 是 通过 
index 给 定 一 个 表达 式 在 汇编 语句 缓冲 区 S 的 开始 位 置 ， 该 过 程 就 用 value 返回 此 表达 式 的 值 。 
例如 ， 虚 拟 计算 机 COMET 的 机 器 指令 可 归属 于 X 型 指令 ， 其 汇编 语句 为 : 


OP RI,N2,X2 
OP RI,N2 


可 以 写 出 下 面 处 理 X 型 指令 的 程序 段 (假定 index 已 指 向 操作 数 在 缓冲 区 S 的 首 地 址 ): 


eval-expr(index,R1); 
index:=index+1; 
eval-expr(index,N2); 
if S[index]= “,’ then 
begin 
index:=index+1; 
eval-expr(index,X2); 
end 
else 
X2:=0; 
类 似 地 ， 可 以 写 出 其 他 类 型 指令 处 理 操作 数 的 程序 段 。 设 当前 可 执行 汇编 语句 的 操作 助 记 
符 在 MOT2 表 的 索引 值 为 i， 则 整个 可 执行 汇编 语句 的 处 理 可 以 描述 如 下 : 
OP:=MOT2[i].binary-code; 
TYPE:=MOT2[i].type; 


case TYPE of 
X': 求 义 型 指令 操作 数 各 部 分 值 ， 然 后 按 规 定 字 节 形 成 指令 ; 


end; 


将 形成 的 指令 送 往 输出 区 ; 

在 第 二 次 扫描 中 ， 根 据 伪 指令 助 记 符 ， 调 用 POT2 表 相 应 元 素 所 规定 的 子 程序 。 例 如 ，DS 
伪 指 令 的 主要 目的 是 预 留存 储 空间 。 不 妨 设 一 个 工作 单元 K〔 初 值 为 0)， 用 于 累计 以 字 节 为 单 
位 的 存储 空间 大 小 。 从 DS 伪 指 令 的 操作 数 区 求 出 K 的 大 小 后 , 就 向 输出 区 送 K 个 空格 以 达到 
保留 所 规定 存储 单元 的 目的 。DC 伪 指 令 处 理 的 结果 是 向 输出 区 送出 转换 得 到 的 常量 。 开 始 伪 
指令 工作 是 输出 目标 程序 开始 的 标准 信息 ， 而 结束 伪 指令 则 是 输出 目标 程序 结束 的 标准 信息 ， 
这 些 信息 都 是 为 装配 程序 提供 的 。 


IX 
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2.2.2 ”编译 程序 基本 原理 


1. 编译 过 程 概述 


编译 程序 的 作用 是 把 某 高 级 语言 书写 的 源 程序 翻译 成 与 之 等 价 的 目标 程序 汇编 语言 或 机 


器 语言 )。 编译 程序 的 工作 过 程 一 般 可 以 分 为 6 个 阶段 , 如 图 2-4 所 示 ， 实际 的 编译 器 
E。 下 面 简 要 介绍 各 阶段 实现 的 主要 功能 。 


将 其 中 的 某 些 阶段 结合 在 一 起 进行 处 到 
1) 词法 分 析 


可 能 会 


源 程 序 可 以 简单 地 被 看 成 是 一 个 多 行 的 字符 串 。 词 法 分 析 阶 段 是 编译 过 程 的 第 一 阶段 ， 这 
个 阶段 的 任务 是 对 源 程 序 从 前 到 后 〈 从 左 到 右 ) 逐个 字符 地 扫描 ， 从 中 识别 出 一 个 个 “单词 ” 
符号 。“ 单 词 ”符号 是 程序 设计 语言 的 基本 语法 单位 ， 如 关键 字 (或 称 保留 字 )、 标 识 符 、 常 数 、 
运算 符 和 分 隔 符 《〈 如 标点 符号 、 左 右 括号 ) 等 。 词 法 分 析 程 序 输出 的 “单词 ” 常 以 二 元 组 的 方 


式 输出 ， 即 单词 类 别 和 单词 自身 的 值 。 


源 程序 


| 


词法 分 析 


语法 分 析 


语义 分 析 


尘 磁 站 由 村 


1 
中 间 代 碍 生成 


图 2-4 编译 器 的 工作 阶段 示意 图 


1 
代码 优化 
1 
目标 代码 生成 


目标 代码 


朋 产 间 匡 


词法 分 析 过 程 依据 的 是 语言 的 词法 规则 , 即 描述 “单词 ”结构 的 规则 。 例 如 , 对 于 某 PASCAL 


源 程序 中 的 一 条 声明 语句 和 赋值 语句 : 


VAR X,Y,Z:real; 
X:=Y+2Z*60; 
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词法 分 析 阶 段 将 构成 这 条 语句 的 字符 串 分 割 成 如 下 17 个 单词 序列 。 


(1) 保留 字 VAR (2) 标识 各 XxX (3) 逗号 

(4) 标识 符 Y (5) 逗号 ; (6) 标识 符 元 
(7) 冒号 : (8) 标准 标识 符 real (9) 分 号 

(10) 标识 符 流 (11) 赋值 号 = (12) 标识 符 Y 
(13) 加 号 十 (14) 标识 符 Zz (15) 乘 号 
(16) 整 常数 60 (17) 分 号 


对 于 标识 符 X、Y、Z， 其 单词 类 别 都 是 id (用 户 标识 符 )， 字 符 串 “X”“Y” 和 “2Z” 都 
是 单词 的 值 ， 而 对 于 单词 60， 整 常数 是 该 单词 的 类 别 ，60 是 该 单词 的 值 。 这 里 用 idl、id2 和 
id3 分 别 代表 X、Y 和 Z， 强 调 标 识 符 的 内 部 标识 由 于 组 成 该 标识 符 的 字符 串 不 同 而 有 所 区 别 。 
经 过 词法 分 析 后 ， 声 明 语句 VAR X,YZ:real; 表 示 为 VAR idl,id2,id3:real， 赋 值 语句 X:=Y+2Z*60; 
表示 为 id1:=id2+id3*60;。 

2) 语法 分 析 

语法 分 析 的 任务 是 在 词法 分 析 的 基础 上 , 根据 语言 的 语法 规则 将 单词 符号 序列 分 解 成 各 类 
语法 单位 ， 如 “表达 式 ”“ 语 句 ” 和 “程序 ”等 。 语 法 规则 就 是 各 类 语法 单位 的 构成 规则 。 通 
过 语法 分 析 确 定 整个 输入 串 是 否 构成 一 个 语法 上 正确 的 程序 。 如 果 源 程序 中 没有 语法 错误 ， 语 
法 分 析 后 就 能 正确 地 构造 出 其 语法 树 ， 和 否则 就 指出 语法 错误 ， 并 给 出 相应 的 诊断 信息 。 对 
id1:=id2+id1*60 进行 语法 分 析 后 形成 的 语法 树 如 图 2-5 所 示 。 


es > 
J 2 


图 2-5 语法 树 示 意图 

词法 分 析 和 语法 分 析 本 质 上 都 是 对 源 程序 的 结构 进行 分 析 。 

3) 语义 分 析 

语义 分 析 阶 段 分 析 各 语法 结构 的 含义 ， 检 查 源 程序 是 否 包 含 静态 语义 错误 ， 并 收集 类 型 信 
息 供 后 面 的 代码 生成 阶段 使 用 。 只 有 语法 和 语义 都 正确 的 源 程序 才能 翻译 成 正确 的 目标 代码 。 

语义 分 析 的 一 个 主要 工作 是 进行 类 型 分 析 和 检查 。 程序 语言 中 的 一 个 数据 类 型 一 般 包 含 两 
面 的 内 容 : 类 型 的 载体 及 其 上 的 运算 。 例 如 ， 整 除 取 余 运算 符 只 能 对 整 型 数据 进行 运算 ， 


在 沪 
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若 其 运算 对 象 中 有 浮 点 数 就 认为 是 一 种 类 型 不 匹配 的 错误 。 

在 确认 源 程序 的 语法 和 语义 之 后 ， 就 可 对 其 进行 翻译 并 给 出 源 程序 的 内 部 表示 。 对 于 声明 
语句 ， 需 要 记录 所 遇 到 的 符号 的 信息 ， 所 以 应 进行 符号 表 的 填 查 工作 。 在 图 2-6 所 示 的 符号 表 
中 ， 每 一 行 存放 一 个 符号 的 信息 。 第 一 行 存放 标识 符 X 的 信息 ， 其 类 型 为 real， 为 它 分 配 的 地 
址 是 0; 第 二 行 存放 y 的 信息 ， 其 类 型 是 real， 为 它 分 配 的 地 址 是 4。 因 此 ， 在 该 语言 中 ， 为 一 
个 real 型 数据 分 配 的 存储 空间 是 4 个 存储 单元 。 对 于 可 执行 语句 ， 则 检查 结构 合理 的 表达 式 是 
否 有 意义 。 对 id1:=id2+id1*60 进行 语义 分 析 后 的 语法 树 如 图 2-6 所 示 ， 其 中 增加 了 一 个 语义 处 
理 节 点 inttoreal， 该 运算 用 于 将 一 个 整 型 数 转换 为 浮 点 数 。 


符号 表 部 分 内 容 二 
-一 和 
idl 
p> ~ 
id2 
> De 
idl i 
60 


图 2-6 语义 分 析 后 的 符号 表 和 语法 树 示意 图 


4) 中 间 代 码 生成 

中 间 代 码 生 成 阶段 的 工作 是 根据 语义 分 析 的 输出 生成 中 间 代 码 。“ 中 间 代 码 ” 是 一 种 简单 
且 含 义 明确 的 记号 系统 ， 可 以 有 若干 种 形式 ， 它 们 的 共同 特征 是 与 具体 的 机 器 无 关 。 最 常用 的 
一 种 中 间 代 码 是 与 汇编 语言 的 指令 非常 相似 的 三 地 址 码 ， 其 实现 方式 常 采用 四 元 式 。 四 元 式 的 
形式 为 : 

(运算 符 ,运算 对 象 1, 运 算 对 象 2, 运 算 结果 ) 


例如 ， 对 语句 X:=Y+Z*60， 可 生成 以 下 四 元 式 序列 : 
© (inttoreal， 60, -,t) 


© (+ id3,t1,t2) 
G@ (+, id2,t2,t3) 
@ (=, 13, -,id1) 


其 中 ，tl、 蕊 、t 是 编译 程序 生成 的 临时 变量 ， 用 于 存放 临时 的 运算 结果 。 
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语义 分 析 和 中 间 代 码 生成 所 依据 的 是 语言 的 语义 规则 。 

5) 代码 优化 

优化 是 一 个 编译 器 的 重要 组 成 部 分 ， 由 于 编译 器 将 源 程序 翻译 成 中 间 代 码 的 工作 是 机 械 
的 、 按 固定 模式 进行 的 ， 因 此 ， 生 成 的 中 间 代 码 往往 在 时 间 和 空间 方面 的 效率 较 差 。 当 需要 生 
成 高 效 的 目标 代码 时 ， 就 必须 进行 优化 。 优 化 过 程 可 以 在 中 间 代 码 生 成 阶段 进行 ， 也 可 以 在 目 
标 代码 生成 阶段 进行 。 由 于 中 间 代 码 不 依赖 于 具体 机 器 ， 此 时 所 做 的 优化 一 般 建立 在 对 程序 的 
控制 流 和 数据 流 分 析 的 基础 之 上 ， 与 具体 的 机 器 无 关 。 优 化 所 依据 的 原则 是 程序 的 等 价 变换 规 
则 。 例 如 ， 在 生成 X:=Y+Z*60 的 四 元 式 后 ，60 是 编译 时 已 知 的 常数 ， 把 它 转换 为 60.0 的 工作 
可 以 在 编译 时 完成 ， 没 有 必要 生成 一 个 四 元 式 ， 同 时 3 仅仅 用 来 将 其 值 传递 给 idl， 也 可 以 化 
简 掉 ， 因 此 上 述 的 中 间 代 码 可 转 优化 成 下 面 的 等 价 代码 : 


© (*,id3,60.0,t1) 
© (+Hid2,tl,id]) 


这 只 是 优化 工作 中 的 一 个 简单 示例 ， 真 正 的 优化 工作 要 复杂 得 多 。 

6) 目标 代码 生成 

目标 代码 生成 是 编译 器 工作 的 最 后 一 个 阶段 。 这 一 阶段 的 任务 是 把 中 间 代 码 变换 成 特定 机 
器 上 的 绝对 指令 代码 、 可 重 定位 的 指令 代码 或 汇编 指令 代码 ， 这 个 阶段 的 工作 与 具体 的 机 器 密 
切 相关 。 例 如 ， 使 用 两 个 寄存 器 R1 和 R2， 可 对 上 述 的 四 元 式 生 成 下 面 的 目标 代码 : 


@ MOVF id3， R2 

©® MULF #60.0,，  R2 

@ MOVF id2, RI 

@ ADDF R2, RI 

© MOV Rl， idl 
这 里 用 # 表 明 60.0 为 常数 。 

7) 符号 表 管 理 


符号 表 的 作用 是 记录 源 程序 中 各 符号 的 必要 信息 ， 以 辅助 语义 的 正确 性 检查 和 代码 生成 ， 
在 编译 过 程 中 需要 对 符号 表 进行 快速 有 效 地 查找 、 插 入 、 修 改 和 删除 等 操作 。 符 号 表 的 建立 可 
以 始 于 词法 分 析 阶 段 ， 也 可 以 放 到 语法 分 析 和 语义 分 析 阶段 ， 但 符号 表 的 使 用 有 时 会 延续 到 目 
标 代码 的 运行 阶段 。 

8) 出 错 处 理 

源 程序 中 不 可 避免 地 会 有 一 些 错误 ， 这 些 错误 大 致 可 分 为 静态 错误 和 动态 错误 。 动 态 错 误 
也 称 动态 语义 错误 ， 它 们 发 生 在 程序 运行 时 ， 例 如 变量 取 零 时 作 除 数 、 引 用 数组 元 素 下 标 错误 
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等 。 静 态 错 误 是 指 编译 阶段 发 现 的 程序 错误 ， 可 分 为 语法 错误 和 静态 语义 错误 ， 如 单词 拼写 错 
表达 式 中 缺少 操作 数 、 括 号 不 匹配 等 有 关 语 言 结构 上 的 错误 称 为 语法 错误 ， 
而 语义 分 析 时 发 现 的 运算 符 与 运算 对 象 类 型 不 合法 等 错误 属于 静态 语义 错误 。 


误 、 标 点 符号 错 、 


在 编译 时 发 现 程序 中 


继续 下 去 ， 以 便 在 一 次 编译 过 程 中 尽 可 能 多 地 找 出 程序 中 的 错误 。 
对 于 编译 器 的 各 个 阶段 ， 在 逻辑 上 可 以 把 它们 划分 为 前 端 和 后 端 两 部 分 。 前 端 包 括 从 词法 
分 析 到 中 间 代 码 生 成 各 阶段 的 工作 ， 后 端 包括 中 间 代 码 优化 和 目标 代码 的 生成 及 优化 等 阶段 。 


的 错误 后 ， 编 译 程序 应 采用 适当 的 策略 修复 它们 ， 使 得 分 析 过 程 能 够 


这 样 ， 以 中 间 代 码 为 分 水 岭 ， 把 编译 器 分 成 了 与 机 器 有 关 的 部 分 和 与 机 器 无 关 的 部 分 。 如 此 一 
来 ， 对 于 各 种 程序 语言 可 以 开发 各 自 的 编译 器 前 端 ， 针 对 指令 系统 和 体系 结构 都 不 同 的 各 种 处 


种 语言 在 各 种 处 到 


器 上 的 编译 器 。 这 样 ， 当 语言 有 改动 时 ， 


如 果 处 理 器 有 改变 ， 仅 替换 该 语言 的 编译 器 后 端 即 可 。 


2. 文法 和 语言 的 形式 描述 


语言 工 是 有 


民 字母 表 三 上 有 限 长 度 字符 串 的 集合 , 这 个 集合 中 的 每 个 字符 


指 制定 出 有 限 个 规则 ， 借 助 它们 就 能 产生 此 语言 的 全 部 句子 。 
1) 字母 表 、 字 符 串 、 字 符 串 集合 及 运算 


。 ”字母 表 Z 和 


如 z={a,b}，a 或 b 是 字符 。 


。 字符 串 : 中 的 字符 组 成 的 有 穷 序列 。 例 如 a，ab，aba，aaaa 都 是 三 的 字符 上 


。 ”字符 串 的 长 度 ， 指 字符 串 中 的 字符 个 数 。 如 |abal=3。 


。 空 串 s: 


由 零 个 字符 组 成 的 序列 ，|e|=0。 


字符 : 字母 表 是 字符 的 非 空 有 穷 集合 ， 字 符 是 字母 表 中 的 一 个 元 素 。 


二 


理 器 开发 相应 的 后 端 ， 最 后 将 每 种 程序 语言 的 前 端 与 各 种 处 理 器 的 后 端 有 机 结合 ， 就 形成 了 每 
只 需要 修改 其 编译 器 的 前 端 部 分 ， 


都 是 按照 一 定 
的 规则 生成 的 。 下 面 从 产生 语言 的 角度 出 发 ， 给 出 文法 和 语言 的 形式 定义 。 所 谓 产 生 语言 ， 


是 


例 


。 连接: 字符 串 8 和 了 的 连接 是 指 将 串 了 接续 在 串 8 之 后 ， 表 示 为 5$*T， 连 接 符 号 :可 省 
略 。 显 然 ， 对 于 字母 表 忆 的 任意 字符 串 $，Se=e*5=5。 
。 了 工 : 是 指 包 括 空 串 s 在 内 的 上 所 有 字符 串 的 集合 。 例 如 ， 设 2={a,b}， 


7 ={6a, 


b,aa,bb,ab,ba,aaa,…}。 


。 ”字符 串 的 方 究 :把 字符 串 cx 自身 连接 次 得 到 的 串 ， 称 为 字符 串 a 的 n 次 方 协 ， 记 为 


n 


Qa"。 al 


=6,0"=Qa0"! =" (n>0)。 


。 ”字符 串 集 合 的 运算 : 设 4，B 代表 字母 表 上 的 两 个 字符 串 集合 。 
> 或 (合并 ): 4UB={alae 4 或 eB}。 
> 积 (连接 ): 4B={aplae 4 有 peB}。 
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> 罕 : 4"=4:4""=4"".A(n>0)， 并 规定 4 ={e}。 
> 正则 闲 包 +: 4:=4UA4UAU…U4"U…。 
> 闭 包 *: 帮 =4 如 U4 入 。 显 然 并 = ZUZUZ2U…UZU…。 
2) 文法 
描述 语言 语法 结构 的 形式 规则 称 为 文法 。 文 法 G 是 一 个 四 元 组 , 可 表示 为 G=(v Vr, 已 9)， 
其 中 三 是 一 个 非 空 有 限 集 ， 其 每 个 元 素 称 为 一 个 终结 符 ;， 芭 是 一 个 非 空 有 限 集 ， 其 每 个 元 素 
称 为 非 终结 符 。 了 友人 万 = 五 ， 即 VW 和 琅 不 含 公共 元 素 。 令 亚 三 故 U 万 ， 称 矿 为 文法 G 的 词 
汇 表 ，V 中 的 符号 称 为 文法 符号 ， 包 括 终结 符 和 非 终 结 符 。SE Vy， 称 为 开始 符号 ， 它 至 少 要 
在 一 条 产生 式 中 作为 左 部 出 现 。 P 是 产生 式 的 有 限 集合 ， 每 个 产生 式 形 如 “a 一 Bp”， 其 中 ，a 称 
为 产生 式 的 左 部 ，a eV? 且 @ 中 至 少 含有 一 个 非 终结 符 ，B 称 为 产生 式 的 右 部 ， 且 BeV"。 若 
干 个 产生 式 @ 王 Bg 二 忆 ,… ,a 一 ,的 左 部 相同 时 ， 可 简写 为 a 十 BIB|…|B,， 称 
B(<igsn) 为 a 的 一 个 候选 式 。 
(1) 文法 的 分 类 。 乔 姆 斯 基 〈Chomsky) 把 文法 分 成 4 种 类 型 ， 即 0 型 、1 型 、2 型 和 3 
型 。 这 4 类 文法 之 间 的 差别 在 于 对 产生 式 要 施加 不 同 的 限制 。 若 文法 G =(Vw, Vz, P, 5) 的 每 个 产 
生 式 ap， 均 有 ae(Vy UW) ，a 至 少 含 有 一 个 非 终结 符 ， 且 Be(Vy UV)， 则 称 G 为 0 型 
文法 。 对 0 型 文法 的 每 条 产生 式 分 别 施加 以 下 限制 ， 则 可 得 以 下 文法 。 
。 1 型 文法 ，G 的 任何 产生 式 a 一 pS 一 除外 ) 均 满 足 |a|<|B| (|x| 表 示 x 中 文法 符号 
的 个 数 )。 
。 ”2 型 文法 : G 的 任何 产生 式 形 如 4 一 Bp， 其 中 4EVy，pBe(Vy UW) 。 
。 3 型 文法 : G 的 任何 产生 式 形 如 4 一 a 或 4aB (或 者 4 一 Ba), 其 中 4, BEV, aE Vi 
0 型 文法 也 称 为 短语 文法 ， 其 能 力 相 当 于 图 灵机 ,任何 0 型 语言 都 是 递归 可 枚 举 的 ; 反之 ， 
递归 可 枚 举 集 也 必定 是 一 个 0 型 语言 。1 型 文法 也 称 为 上 下 文 有 关 文 法 ， 它 意味 着 对 非 终结 符 
的 替换 必须 考虑 上 下 文 ， 并 且 一 般 不 允许 替换 成 。 串 。 例 如 ， 若 a4B 一 ayB 是 1 型 文法 的 产生 
式 ，x 和 有 不 全 为 室 ， 则 非 终 结 符 4 只 有 在 左边 是 a， 右边 是 8 的 上 下 文中 才能 替换 成 »。2 型 
文法 就 是 上 下 文 无 关 文法 ， 其 非 终 结 符 的 替换 无 须 考 虑 上 下 文 。3 型 文法 等 价 于 正规 式 ， 因 此 
也 被 称 为 正规 文法 或 线性 文法 。 
若 文 法 G 与 文法 G, 产生 的 语言 相同 ， 即 5(G) = Z(G;) ， 则 称 这 两 个 文法 是 等 价 的 。 
(2) 句子 和 语言 。 设 有 文法 G=(v Vr, P, 9) 
。 ”推导 与 直接 推导 推导 就 是 从 文法 的 开始 符号 8 出发， 反复 使 用 产生 式 ， 将 产生 式 左 
部 的 非 终 结 符 蔡 换 为 右 部 的 文法 符号 序列 《展开 产生 式 用 之 表示 )， 直 到 产生 一 个 终 
结 符 的 序列 时 为 止 。 若 有 产生 式 wc 下 Be P, 且 y,6 eV ， 则 ya6 一 7655 称 为 文法 G 中 
的 一 个 直接 推导 ， 并 称 ya5 可 直接 推导 出 755 。 显 然 ， 对 PP 中 的 每 一 个 产生 式 & > pp 
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都 有 a 二 B。 若 在 文法 中 存在 一 个 直接 推导 序列 , 即 wm 志 a 寺 2 和 寺 … 寺 (n>0)， 
则 称 oo 可 推导 出 w ,au 是 和 的 一 个 推导 ， 并 记 为 ou 六 on 。 记号 mo 字 m 表示 


这 
oo = 或 者 wo 一 an 。 
G 


。 ”直接 归 约 和 归 约 : 归 约 是 推导 的 逆 过 程 。 若 文法 G 中 有 一 个 直接 推导 a => Bp， 则 称 


J 直接 归 约 成 a， 或 a 是 的 一 个 直接 归 约 。 若 文法 G 中 有 一 个 推导 y 坊 5， 则 称 5 
可 归 约 成 >， 或 > 是 6 的 一 个 归 约 。 

型 和 人 句子， 车 文法 G 的 开始 符号 为 5S， 那么 ， 从 开始 符号 8 能 推导 出 的 符号 串 称 为 
文法 的 一 个 名 型 ， 即 是 文法 G 的 一 个 句 型 ， 当 上 且 仅 当 有 如 下 推导 5 地 wa eV”。 若 


了 是 文法 G 的 一 个 句 型 ， 且 Xe ， 则 称 凶 是 文法 G 的 一 个 句子 ， 即 仅 含 终结 符 的 

句 型 是 一 个 句子 。 

。 语言 : 从 文法 G 的 开始 符号 出 发 ， 能 推导 出 的 句子 的 全 体 称 为 文法 G 产生 的 语言 ， 记 
为 L(G)。 


3， 词法 分 析 


语言 中 具有 独立 含义 的 最 小 语法 单位 是 符号 〈 单 词 )， 如 标识 符 、 无 符号 常数 与 界限 符 等 。 
词法 分 析 的 任务 是 把 构成 源 程序 的 字符 串 转换 成 单词 符号 序列 。 词 法 规则 可 用 3 型 文法 (正规 
文法 ) 或 正规 表达 式 描述 ， 它 产生 的 集合 是 语言 规定 的 基本 字符 集 光 (字母 表 ) 上 的 字符 串 的 
一 个 子 集 ， 称 为 正规 集 。 

1) 正规 表达 式 和 正规 集 

对 于 字母 表 二 ， 其 上 的 正规 式 及 其 表示 的 正规 集 可 以 递归 定义 如 下 。 

(1) ge 是 一 个 正规 式 ， 它 表示 和 集合 L(e)= {e}。 

(2) 若是 并 上 的 字符 ， 则 a 是 一 个 正规 式 ， 它 所 表示 的 正规 集 为 {a}。 

(3) 若 正规 式 r+ 和 s 分 别 表示 正规 集 ZD 和 Ze)， 则 : 

Q@ 小 是 正规 式 ， 表 示 和 集合 L(r) UL(s)。 

加 ”"s 是 正规 式 ， 表 示 集 合 L(r)L(s)。 

@ "是 正规 式 ， 表 示 集 合 (LOD) 。 

@ (是 正规 式 ， 表 示 集 合 L(7)。 
仅 由 有 限 次 地 使 用 上 述 三 个 步骤 定义 的 表达 式 才 是 王 上 的 正规 式 ， 其 中 运算 符 “|”“。?” 
“*#” 分 别称 为 “或 ”“ 连 接 ” 和 “ 闭 包 ”。 在 正规 式 的 书写 中 ， 连 接 运算 符 “。 ”可 省 略 。 运 算 
符 的 优先 级 从 高 到 低 顺 序 排列 为 “*”“。”“ | ”。 

设 5={a,b}， 表 2-1 列 出 了 上 的 一 些 正规 式 和 相应 的 正规 集 。 


也 | 


可 


第 2 章 “程序 语言 基础 知识 “ 国 "> 荐 


若 两 个 正规 式 表示 的 正规 集 相 同 ， 则 认为 二 者 等 价 。 两 个 等 价 的 正规 式 UU 入 记 为 U=V。 
例如 ，b(ab)”=(ba)” b，(alb)=(a'b)。 设 U、V 和 W 均 为 正规 式 ， 正 规 式 的 代数 性 质 如 表 2-2 
所 示 。 


表 2-1 正规 式 与 正规 集 示例 


正规 式 正规 集 

a 字符 惠 op 构成 的 集合 表 2-2 正规 式 的 代数 性 质 

alb 字符 串 a、b 构成 的 集合 UV=MU (UNDW= U(VW) 

由 0 个 或 多 个 < 构成 的 字符 串 集合 村 a 

Gly 所 有 字符 a 和 必 构 成 的 串 的 集合 (IW UV IN | ev-UeU 

al(q6) ”| 以 a 为 首 字 符 的 a、 5 字符 申 的 集合 UVIm= Uvuw | v= (Vp) 

(alb)* abb | 以 abb 结尾 的 a、b 字符 串 的 集合 (UMWUWIVW| = 

2) 有 限 自动 机 

有 限 自动 机 是 一 种 识别 装置 的 抽象 概念 ， 它 能 准确 地 识别 正规 集 。 有 限 自动 机 分 为 确定 的 
有 限 自动 机 和 不 确定 的 有 限 自动 机 两 类 。 

(1) 确定 的 有 限 自动 机 (Deterministic Finite Automata，DFA)。 一 个 确定 的 有 限 自 动机 是 


个 五 元 组 (S$，z，, f，so，2Z)， 其 中 : 

。 5 是 一 个 有 限 集 ， 其 每 个 元 素 称 为 一 个 状态 。 

。 是 一 个 有 穷 字母 表 ， 其 每 个 元 素 称 为 一 个 输入 字符 。 

。 f 是 SXz->S 上 的 单 值 部 分 映像 。f (4,a)=Q 表示 当前 状态 为 4、 输入 为 a 时 ， 将 转换 

到 下 一 状态 0。 称 2 为 A 的 一 个 后 继 状 态 。 

。 ”soE5，so 称 为 开始 状态 ， 是 唯一 的 。 

。 Z 是 非 空 的 终止 状态 集合 ，Z C5 。 

一 个 DFA 可 以 用 两 种 直观 的 方式 表示 : 状态 转换 图 和 状态 转换 矩阵 。 状 态 转换 图 简称 为 
转换 图 ， 是 一 个 有 向 图 。DFA 中 的 每 个 状态 对 应 转换 图 中 的 一 个 节点 ，DFA 中 的 每 个 转换 函数 
对 应 图 中 的 一 条 有 向 弧 ， 若 转换 函数 为 K4,a)=O@， 则 该 有 向 弧 从 节点 4 出发， 进入 节点 CO， 字 
符 a 是 弧 上 的 标记 。 

【 例 2.1】 已 知 有 DFA M1= ({so sis 53} ,，{a,b}， fso, {5s3})， 其 中 了 为 : 

hsoa)=s1, fso,b)=s2, fsi,a)= 5s3» fs1,b)=s2, hls»a)=s1, fs2,b)= 5s3, fs3,a)= s3 

与 DFA M1 对 应 的 状态 图 如 图 2-7 (a) 所 示 ， 其 中 ， 双 圈 表 示 的 节点 是 终 态 节点 。 状 态 转 
换 和 矩阵 可 以 用 一 个 二 维 数组 G 表示 , 矩阵 元 素 G[4,a] 的 行 下 标 表示 状态 , 列 下 标 表示 输入 字符 ， 
G[4,a] 的 值 是 当前 状态 为 4、 输 入 为 a 时 ， 应 转换 到 的 下 一 状态 。 与 DFA M1 对 应 的 状态 转换 
矩阵 如 图 2-7 (b) 所 示 。 在 转换 矩阵 中 ， 一 般 以 第 一 行 的 行 下 标 所 对 应 的 状态 作为 初 态 ， 而 终 
态 则 需要 特别 指明 。 
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(a) 状态 转换 图 (b) 状态 转换 矩阵 


图 2-7 DFA 的 状态 转换 图 和 转换 矩阵 


对 于 王 中 的 任何 字符 串 w， 若 存在 一 条 从 初 态 节点 到 某 一 终 态 节点 的 路 径 ， 且 这 条 路 径 上 
所 有 弧 的 标记 符 连接 成 的 字符 串 等 于 。， 则 称 6 可 由 DFA M 识别 (接受 或 读 出 )。 若 一 个 DFA 
M 的 初 态 节 点 同时 又 是 终 态 节点 ， 则 空 字 g 可 由 该 DFA 识别 (或 接受 )。DFA M 所 能 识别 的 语 
言 LM)= { olo 是 从 M 的 初 态 到 终 态 的 路 径 上 的 弧 上 标记 所 形成 的 串 }。 

三 上 的 一 个 字符 串 集合 亚 是 正规 的 ， 当 且 仅 当 存在 三 上 的 一 个 DFA M， 且 大 L(M)。 

(2) 不 确定 的 有 限 自动 机 (Nondeterministic Finite Automata，NFA )。 一 个 不 确定 的 有 限 自 
动机 也 是 一 个 五 元 组 ， 它 与 确定 有 限 自 动机 的 区 别 如 下 。 

@ f 是 SX 一 2 上 的 映像 。 对 于 5 中 的 一 个 给 定 状 态 及 输入 符号 , 返回 一 个 状态 的 集合 。 
即 当前 状态 的 后 继 状 态 不 一 定 是 唯一 的 。 

@ 有 向 弧 上 的 标记 可 以 是 e。 

【 例 2.2】 已 知 有 NFA N= 〈{fso sb 52, 53}, fa 四 ,sofss})， 其 中 为: 

Jsoa)= so, fso,a)= $s1, sosb)= so, fs1,b)=s2, fs2,b)= ss 

与 NFAN 对 应 的 状态 转换 图 和 状态 转换 矩阵 如 图 2-8 所 示 。 


a 
a 六 6 a - | 上 四 | 
OO ee 
| | 
(a) 状态 转换 图 (b) 状态 转换 矩阵 
图 2-8 NFA 的 状态 转换 图 和 转换 矩阵 


显然 , DFA 是 NFA 的 特例 。 实际 上 , 对 于 每 个 NFA N, 都 存在 一 个 DFAM, 且 LM)=L(N)。 
对 于 任何 两 个 有 限 自动 机 M1 和 M2， 如 果 ZCMD=L(CM2)， 则 称 M1 和 M2 是 等 价 的 。 
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(3) NFA 到 DFA 的 转换 。 

任何 一 个 NFA 都 可 以 转换 为 DFA， 下 面 先 定义 转换 过 程 中 需要 的 计算 。 

定义 1: 状态 集 了 的 s 闭 包 。 

若 7 是 NFA X 的 状态 集合 的 一 个 子 集 ， 定 义 e_CLOSURE(D 如 下 。 

。 ”状态 集 了 的 e。_CLOSURE(D 是 一 个 状态 集 。 

。 ”状态 集 了 的 所 有 状态 属于 e_CLOSURECD)。 

。 若 sE7T， 那么 从 s 出 发 经 过 任意 条 s 弧 到 达 的 状态 部 属于 se_CLOSURE(CD。 

状态 集 。_CLOSURE(D 称 为 了 的 。_ 闭 包 。 

由 以 上 的 定义 可 知 , 的 6_ 闭 包 就 是 从 状态 集 了 的 状态 出 发 ,经 s 所 能 到 达 的 状态 的 全 体 。 

定义 2: 状态 集 了 的 对 字符 a 的 状态 转移 。 

假定 1 是 NFA N 的 状态 集 的 一 个 子 集 ，a 是 中 的 一 个 字符 ， 定 义 : 

L=8_CLOSURE()) 

其 中 , J 是 所 有 那些 可 从 了 中 的 某 一 状态 节点 出 发 经 过 一 条 a 弧 而 到 达 的 状态 节点 的 全 体 。 

用 子 集 法 将 一 个 NFA 转换 为 一 个 DFA。 

设 NFA N= (8， 了 ,jso, Z)， 与 之 等 价 的 DFA M= (8 2, 太 go Z')， 用 子 集 法 将 非 确定 的 
有 限 自 动机 确定 化 的 算法 步骤 如 下 。 

@ 求 出 DFA M 的 初 态 go， 即 令 go=s_CLOSURE({so})， 此 时 8' 仅 含 初 态 go， 并 且 没有 


@ 对 于 8 中 尚未 标记 的 状态 g = {ssi2，… ,sim}，sy eS(j=1,…,m) 进行 以 下 处 理 。 

。 ”标记 4 ， 以 说 明 该 状态 已 经 计算 过 。 

。 ”对 于 每 个 ae, 令 Tf({si5i2, sm)}a，9) =E_CLOSURE(T) 。 

。 若 gj 尚 不 在 S' 中 ， 则 将 gq, 作 为 一 个 未 加 标记 的 新 状态 添加 到 8， 并 把 状态 转换 函数 
f(g; ,4g) 添加 到 DFAM 中。 

@ 重复 进行 步骤 @@， 直 到 5S' 中 不 再 出 现 未 标记 的 状态 时 为 止 。 

@ 人 Zs={qlqeSs'HgNZ #6}. 
【 例 2.3】 已 知 一 个 识别 正规 式 ab*a 的 非 确定 有 限 自动 机 ， 其 状态 转换 图 如 图 2-9 所 示 ， 

用 子 集 法 将 其 转换 为 DFA M。 


图 2-9 ”ab*a 的 NFA 状态 转换 图 
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根据 se_CLOSURE 的 定义 ,可 以 求 出 se _ CLOSURE({0})={0}, 将 {0} 记 为 DFA 的 初 态 go。 
然后 根据 题 中 所 给 的 状态 转换 图 以 及 算法 步骤 @ 求 解 DFA M 的 各 个 状态 的 过 程 如 下 。 

6_CLOSURE(qo,a)={1,2,4}， 将 {1,2,4} 记 为 q1; e_CLOSURE(qo,b)= 们 ， 标 记 go。 

s_CLOSURE(qi,a)={5}， 将 {5} 记 为 9 〈 终 态 )。 

6_CLOSURE(q1,b)={2,3,4}， 将 {2,3,4} 记 为 g3， 标 记 qi。 

6_CLOSURE(g»,a)={}，s_CLOSURE(q;,b)={}， 标 记 g2。 

£_CLOSURE(qg3,a)={5}, Bh gq,。 

6_CLOSURE(gq3,b)={2,3,4}， 即 qs， 标记 ga。 

当 5S' 中 没有 未 标记 的 状态 时 ， 算 法 即 可 终止 ， 所 得 的 DFA M 如 图 2-10 所 示 。 

从 NFA 转换 得 到 的 DFA 不 一 定 是 最 优 的 ， 可 以 通过 等 价 变换 将 DFA 进行 最 小 化 处 理 。 
对 于 有 限 自动 机 中 的 任何 两 个 状态 上 和 *， 若 从 其 中 一 个 状态 出 发 接受 输入 字符 串 @， 而 
从 另 一 状态 出 发 不 接受 w， 或 者 从 上 和 * 出 发 到 达 不 同 的 接受 状态 ， 则 称 w 对 状态 * 和 + 是 可 
区 分 的 。 若 状态 s 和 不 可 区 分 ， 则 称 其 为 可 以 合并 的 等 价 状态 。 

对 图 2-10 所 示 的 自动 机 进行 化 简 所 得 的 DFA， 如 图 2-11 所 示 。 


OO 全 


图 2-10 识别 ab*a 的 DFA 示意 图 图 2-11 识别 ab*a 的 最 小 化 DFA 示意 图 


3) 正规 式 与 有 限 自 动机 之 间 的 转换 
正规 式 与 有 限 自 动机 间 可 以 相互 转换 。 

(1) 有 限 自动 机 转换 为 正规 式 

对 于 己 上 的 NFA M， 可 以 构造 一 个 上 的 正规 式 R， 使 得 L(R)=L(M)。 

拓 广 状态 转换 图 的 概念 ， 令 每 条 弧 可 用 一 个 正规 式 作 标记 。 为 了 上 的 NFA M 构造 相应 的 
正规 式 R， 分 为 如 下 两 步 。 

第 一 步 : 在 M 的 状态 转换 图 中 加 两 个 节点 , 一 个 x 节点, 一 个 yy 节点。 从 x 节点 到 NFAM 
的 初始 状态 节点 引 一 条 弧 并 用 标记 ,从 NFA M 的 所 有 终 态 节点 到 yy 节点 引 一 条 弧 并 用 se 标记 。 
形成 一 个 与 M 等 价 的 M'，HM' 只 有 一 个 初 态 x 和 一 个 终 态 y。 

第 二 步 : 按 下 面 的 方法 逐步 消去 M' 中 除 x 和 y 的 所 有 节点 。 在 消除 节点 的 过 程 中 ， 用 正规 
式 来 标记 弧 , 最 后 节点 x 和 ?之 间 弧 上 的 标记 就 是 所 求 的 正规 式 。 消 除 节 点 的 规则 如 图 2-12 所 示 。 
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对 于 Ri R; 代 之 以 ( ) RIR» Rs: C ) 


图 2-12 有 限 自 动机 到 正规 式 的 转换 规则 示意 图 


(2) 正规 式 转换 为 有 限 自动 机 ， 
同样 地 ， 对 于 荆 上 的 每 个 正规 式 R， 可 以 构造 -个 2 的 一 -GO 人 
NFA M， 使 得 LM)=L(R)。 
对 于 正规 式 R， 可 用 图 2-13 所 示 的 拓 广 状态 图 表示 。 图 2335 者 站 状 态 图 
通过 对 正规 式 进行 分 净 并 加 入 新 的 节点 , 过 步 把 图 转变 成 每 条 弧 上 的 标记 是 对 上 的 一 个 
字符 或 e， 转 换 规则 如 图 2-14 所 示 。 


对 于 © RIR， 个 代 之 以 四 RI ® Rs @ 


RI 


"OED mw OT HOD 


Ra 


R 


图 2-14 正规 式 到 有 限 自动 机 的 转换 规则 示意 图 


最 后 所 得 的 图 即 为 一 个 NFA M，x 为 初 态 节 点 ，y 为 终 态 节 点 。 显 然 ，L(M)=L(R)。 

4) 词法 分 析 器 的 构造 

构造 词法 分 析 器 的 一 般 步 又 为 : 用 正规 式 描述 语言 中 的 单词 构成 规则 ;为 每 个 正规 式 构造 
一 个 NFA， 它 识别 正规 式 所 表示 的 正规 集 ; 将 构造 出 的 NFA 转换 成 等 价 的 DFA; 对 DFA 进行 
最 小 化 处 理 ， 使 其 最 简 ; 最 后 用 手工 编码 或 表 驱 动 的 方式 从 最 简 DFA 构造 词法 分 析 器 。 


4. 语法 分 析 


语法 分 析 的 任务 是 根据 语言 的 语法 规则 ， 分析 单词 串 是 否 构 成 短语 和 句子 ， 即 是 否 为 合法 
的 表达 式 、 语 句 和 程序 等 基本 语言 结构 ， 同 时 检查 和 处 理 程序 中 的 语法 错误 。 程 序 设计 语言 的 
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绝 大 多 数 语法 规则 可 以 采用 上 下 文 无 关 文法 进行 描述 。 语 法 分 析 方法 有 多 种 ， 根 据 产生 语法 树 
的 方向 ， 可 分 为 自 底 向 上 《或 自 下 而 上 ) 和 自 项 向 下 (或 自 上 而 下 ) 两 类 。 

1) 上 下 文 无 关 文法 

上 下 文 无 关 文法 属于 乔 姆 斯 基 定义 的 2 型 文法 ,被 广泛 地 用 于 表示 各 种 程序 设计 语言 的 语 
法 。 对 于 上 下 文 无 关 文法 G[S- (WV, 忆 9)， 其 产生 式 的 形式 都 是 4 一 p， 其 中 4E 队 
Be(W UV). 

若 不 加 特别 说 明 ， 下 面 用 大 写 英文 字母 4、B8、C 等 表示 非 终结 符 ， 小 写 英文 字母 a、b、c 
等 表示 终结 符号 ，u ww 等 表示 终结 符号 串 ， 小 写 希腊 字母 a、p、y、5 等 表示 终结 符 和 非 终结 
符 构 成 的 文法 符号 串 。 由 于 一 个 上 下 文 无 关 文 法 的 核心 部 分 是 其 产生 式 集合 ， 所 以 文法 可 以 简 
写 为 其 产生 式 集合 的 描述 形式 。 

(1) 规范 推导 最 右 推导 )。 如 果 在 推导 的 任何 一 步 a => 8 (其 中 a、p 是 句 型 )， 都 是 对 a 
中 最 右边 的 非 终结 符 进行 替换 ， 则 称 这 种 推导 为 最 右 推导 。 最 右 推导 常 称 为 规范 推导 。 同 理 可 
定义 最 左 推导 。 
(2) 短语 、 直 接 短语 和 句柄 。 设 a68 是 文法 G 的 一 个 名 型， 即 Sa8， 且 满足 8->a4p 


和 4 过 6， 则 称 6 是 句 型 g68 相对 于 非 终 结 符 4 的 短语 。 特 别 地 ， 如 果 有 4 之 5， 则 称 6 是 句 
型 g68 相对 于 产生 式 4 一 6 的 直接 短语 。 一 个 句 型 的 最 左 直接 短语 称 为 该 句 型 的 句柄 。 
【 例 2.4】 对 于 简单 算术 表达 式 ， 可 以 用 下 面 的 文法 G[ 可 进行 描述 。 
GIE]= ({BT,F}, {+,*, (,) Jid} ,PE) 
P={E>7T|E+T,T>F| TF, P(E) |id} 
可 以 证 明 ，id+tid*id 是 该 文法 的 句子 。 下 面 用 最 右 推 导 的 方式 从 文法 的 开始 符号 出 发 推导 
出 该 句子 。 为 了 表示 推导 过 程 中 相同 文法 符号 的 不 同 次 出 现 ， 给 符号 加 一 个 下 标 。 
EE+TSE+D*AB+D*id = b+b*id, = E +id,*id, 
SD+id,*id Sb +id, *id, id +id, *id, 
该 推导 过 程 可 以 用 树 型 结构 进行 描述 ， 如 图 2-15 所 示 。 
由 于 E 达 + 多 *id， 且 帮 记 ， 所 以 二 是 句 型 Eitidy*id 的 相对 于 非 终结 符 7 的 短语 。 
由 于 过 羽 +id,*id;， 且 二 id ， 所 以 idl 是 句 型 idi+tidy*id; 相 对 于 非 终结 符 的 短语 ， 
也 是 相对 于 产生 式 F 一 id 中 下 的 直接 短语 。 
由 于 才思 +T， 且 克 放 jd,*id;， 所 以 地 * 达 是 名 型 Bitid*id 的 相对 于 非 终 结 符 7 的 


由 于 忆 访 jd +id,*id;， 所 以 iditids*idy 是 句 型 iditids*id; 的 相对 于 非 终结 符 E 的 短语 。 
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图 2-15 推导 过 程 示意 图 


实际 上 ia ie ids, ids*id3 和 idi+tidy*id; 都 是 句 型 iditids*id; 的 短语 , 而 且 idi, id, id; 均 是 直 
接 短语 ， 其 中 idi 是 最 左 直 接 短语 ， 即 句柄 。 

2) 自 顶 向 下 语法 分 析 方 法 

自 顶 向 下 分 析 法 的 基本 思想 是 : 对 于 给 定 的 输入 串 w@， 从 文法 的 开始 符号 5 出 发 进行 最 左 
推导 ， 直 到 得 到 一 个 合法 的 句子 或 者 发 现 一 个 非法 结构 。 在 推导 的 过 程 中 试图 用 一 切 可 能 的 方 
法 ， 自 上 而 下 、 从 左 到 右 地 为 输入 串 w 建立 语法 树 。 整 个 分 析 过 程 是 一 个 试探 的 过 程 ， 是 反复 
使 用 不 同 产生 式 谋求 与 输入 序列 匹配 的 过 程 。 若 输入 串 是 给 定 文法 的 句子 ， 则 必 能 成 功 ， 反 之 

文法 中 存在 下 述 产 生 式 时 ， 自 顶 向 下 分 析 过 程 中 会 出 现下 面 的 问题 。 

(1) 若 文 法 中 存在 形 如 4 一 aB|a5 的 产生 式 ， 即 4 产生 式 中 有 多 于 一 个 候选 项 的 前 级 相 
同 〈 称 为 公共 左 因子 ， 简 称 左 因子 )， 则 可 能 导致 分 析 过 程 中 的 回溯 处 理 。 

(2) 车 文法 中 存在 形 如 4-4 a 的 产生 式 ， 由 于 采取 了 最 左 推导 ， 可 能 会 造成 分 析 过 程 陷 
入 死 循环 的 情况 ， 产 生 式 的 这 种 形式 被 称 为 左 递归 。 
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因此 ， 需 要 对 文法 进行 改造 ， 消 除 其 中 的 左 递 轨 ， 以 避免 分 析 陷 入 死 循 环 ， 提取 左 因子 ， 
以 避免 回溯 。 

(3) 递归 下 降 分 析 法 。 递 归 下 降 分 析 法 直接 以 子 程序 调用 的 方法 模拟 产生 式 产生 语言 的 过 
程 ， 其 基本 思想 是 : 为 每 一 个 非 终结 符 构造 一 个 子 程序 ， 每 个 子 程序 的 过 程 体 按 该 产生 式 候选 
项 分 情况 展开 ， 遇 到 终结 符 即 进行 匹配 ， 而 遇 到 非 终结 符 则 调用 相应 的 子 程序 。 该 分 析 法 从 调 
用 文法 开始 符号 的 子 程序 开始 ， 直 到 所 有 非 终结 符 都 展开 为 终结 符 并 得 到 匹配 为 止 。 若 分 析 过 
程 可 以 达到 这 一 步 ， 则 表明 分 析 成 功 ， 否 则 表明 输入 串 中 有 语法 错误 。 递 归 下 降 分 析 法 的 优点 
是 简单 且 易 于 构造 ， 缺 点 是 程序 与 文法 直接 相关 ， 对 文法 的 任何 改变 都 需要 在 程序 中 进行 相应 


的 修改 。 
(4) 预测 分 析 法 。 预 测 分 析 法 是 另 一 种 自 顶 向 下 的 语法 分 析 方 法 ， 其 基本 模型 如 图 2-16 
所 示 。 
输入 符号 串 
Ee 
输出 
里 一 = 一 | 驱动 器 
符 
号 
| 
预测 
分 析 表 
图 2-16 ”预测 分 析 模 型 示意 图 


预测 分 析 法 的 核心 是 预测 分 析 表 ， 可 以 用 一 个 二 维 数 组 M 表示 ， 其 元 素 MI4,a]( AE Vy, a 
EVrU 失 存放 关于 4 的 产生 式 ， 表 明 当 遇 到 输入 符号 为 g 且 用 4 进行 推导 时 ， 所 应 采用 的 产生 
式 ; 若 M[4,a] 为 error， 则 表明 推导 时 遇 到 了 不 该 出 现 的 符号 ， 应 进行 出 错 处 理 。 

例如 ， 根 据 文法 G[2J={E 一 TE BE 一 +TE'|s, 7 一 FT T 一 *F7T" | F 一 (| 过 构造 的 预测 分 
析 表 如 表 2-3 所 示 。 


表 2-3 预测 分 析 表 
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预测 分 析 法 的 工作 过 程 : 初始 时 ， 将 “#” 和 文法 的 开始 符号 依次 压 入 栈 中 ; 在 分 析 过 程 
中 ， 根 据 输入 串 中 的 当前 输入 符号 gc 和 当前 的 栈 顶 符号 邓 进 行 处 理 。 

车 对 =a= 类 ， 则 分 析 成 功 ， 若 卫 = 多 且 wa 关 镶 ， 则 出 错 。 

车 XEVr 且 XX=a， 则 XX 退 栈 ， 并 读 入 下 一 个 符号 a; 车 XeVr 且 舒 a， 则 出 错 。 

车 XEVy 且 MI[X,a]='4 一 a'， 则 了 退 栈 ，w 中 的 符号 从 右 到 左 依次 进 栈 〈e 无 须 进 栈 ); 若 
AM[X,al='error"， 则 调用 出 错 程序 进行 处 理 。 

3) 自 底 向 上 语法 分 析 方 法 

常用 的 自 底 向 上 分 析 方 法 也 称 移 进 - 归 约 分 析 法 ,工作 模型 是 下 推 自动 机 ,如 图 2-17 所 示 。 
其 基本 思想 是 对 输入 序列 w 自 左 向 右 进行 扫描 ， 并 将 输入 符号 逐个 移 进 一 个 栈 中 ， 边 移 进 边 分 
析 ， 一 旦 栈 顶 符号 串 形成 某 个 句 型 的 可 归 约 串 〈 即 句柄 ) 时 ， 就 用 某 个 产生 式 的 左 部 非 终结 符 
来 奉 代 ， 这 称 为 一 步 归 约 。 重 复 这 一 过 程 ， 直 至 栈 中 只 剩 下 文法 的 开始 符号 且 输入 串 也 被 扫描 
完 时 为 止 ， 确 认输 入 串 w 是 文法 的 句子 ， 表 明 分 析 成 功 ;， 和 否则， 进行 出 错 处 理 。 


输入 符号 串 
| | ip 
sp 一 | 符 驱动 器 输出 
号 
状 
态 移 进 - 归 约 
栈 分 析 表 
图 2-17 移 进 - 归 约 分 析 模 型 


LR 分 析 法 是 一 种 规范 归 约 分 析 法 。 规 范 归 约 是 规范 推导 (最 右 推 导 ) 的 逆 过 程 ， 下 面 举例 
说 明 规范 归 约 的 过 程 。 

【 例 2.5】 设 文法 G[S]={ S 一 adcBe, 4 一 b, 4 一 4b, Bd}， 下 面 对 输 入 串 #abbcde# (# 为 
始 和 结束 标志 符号 ) 进行 分 析 。 先 设 一 个 初始 为 空 的 符号 栈 ， 并 把 “#” 放 入 栈 中 ， 其 分 析 过 
程 如 下 。 


步骤 符号 栈 输入 符号 串 动作 
(1) # abbcde# 移 进 
(2) #a bbcde# 移 进 


(3) #ab bcde# 归 约 (依据 4 一 bp， 将 b 替换 为 4) 
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(4) #ad bcde# 移 进 

(5) #aAb cde# 归 约 (依据 4 一 4bp， 将 4b 替换 为 4) 

(6) #ad cde# 移 进 

(7) #aAc de# 移 进 

(8) #aAcd e# 归 约 (依据 B 一 d， 将 d 蔡 换 为 B) 

(9) #aAdcB e# 移 进 

(10) #aAcBe # 归 约 (依据 5S~a4dcBe， 将 a4cBe 替换 为 5) 
(11) #S # 接受 


说 明 : 在 第 (3) 步 中 栈 顶 符号 串 b 是 句 型 abbcde 的 句柄 ， 用 产生 式 4 一 进行 归 约 ; 第 
(5) 步 中 栈 顶 的 45 是 句 型 a4bcde 的 句柄 , 用 相应 产生 式 4 一 *42 进行 归 约 ; 第 (8) 步 和 第 (10) 


步 是 同样 的 道理 。 上 述 分 析 过 程 也 可 看 成 是 自 底 向 上 构造 语法 树 的 过 程 。 


LR 分 析 法 根据 当前 分 析 栈 中 的 符号 串通 常 以 状态 表示 〉 和 向 右 顺序 查看 输入 串 的 个 


(Kk 宇 0) 符号 ， 就 可 唯一 确定 分 析 器 的 动作 是 移 进 还 是 归 约 ， 以 及 用 哪 条 产生 式 进 行 归 约 ， 因 而 
也 就 能 唯一 地 确定 句柄 。 当 厂 1 时 ， 已 能 满足 当前 绝 大 多 数 高 级 语言 编译 程序 的 需求 。 常 用 的 


LR 分 析 器 有 LR(0)、SLR(1)、LALR(1) 和 LR(1)。 
一 个 LR 分 析 器 由 如 下 三 个 部 分 组 成 。 
(1) 驱动 器 ， 或 称 驱动 程序 。 对 所 有 LR 分 析 器 ， 驱 动 程序 都 是 相同 的 。 


(2) 分 析 表 。 不 同 的 文法 具有 不 同 的 分 析 表 。 同 一 文法 采用 不 同 的 LR 分 析 器 时 ， 分 析 表 


也 不 同 。 分 析 表 又 可 分 为 动作 表 (ACTION) 和 状态 转换 表 (GOTO) 两 个 部 分 ， 
二 维 数组 表示 。 
(3) 分 析 栈 。 包 括 文法 符号 栈 和 相应 的 状态 栈 。 


它们 都 可 


分 析 器 的 动作 由 栈 顶 状态 和 当前 输入 符号 决定 (LR(0) 分 析 器 不 需 向 前 查看 输入 符号 ), LR 


分 析 器 的 模型 如 图 2-18 所 示 。 


输入 ai | Ee a “oe an | # 
| ip 
SP | ss OQ 驱动 器 箱 出 
Ws | 大 
[LL#|s ACTION 表 GOTO 表 
符号 、 状 态 栈 


图 2-18 LR 分 析 器 模型 示意 图 
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其 中 SP 为 栈 项 指针 ，5; 为 状态 ， 基 为 文法 符号 。ACTION[S;, a]= 8 规定 了 栈 项 状态 为 5; 
且 遇 到 输入 符号 e 时 应 执行 的 动作 。 状 态 转换 表 GOTO[S, 旭 =5; 表 示 当 状态 栈 顶 为 5; 且 文法 符 
号 栈 顶 为 时 应 转向 状态 9。 

LR 分 析 器 的 工作 过 程 以 格局 的 变化 来 反映 。 格 局 的 形式 为 ( 栈 ， 剩 余 输 入 ,动作 )。 分 析 
是 从 某 个 初始 格局 开始 的 ， 经 过 一 系列 的 格局 变化 ， 最 终 达 到 接受 格局 ， 表 明 分 析 成 功 ; 或 者 
达到 出 错 格局 ， 表 明 发 现 一 个 语法 错误 。 因 此 ， 开 始 格 局 的 剩余 输入 应 该 是 全 部 的 输入 序列 ， 
而 接受 格局 中 的 剩余 输入 应 该 为 空 ， 任 何其 他 格局 或 者 出 错 格局 中 的 剩余 输入 应 该 是 全 部 输入 
序列 的 一 个 后 级 。 

在 LR 分 析 过 程 中 ， 改 变 格局 的 动作 有 以 下 4 种 。 

(1) 移 进 (Shift)。 当 ACTION[S, a]= 8 时 ， 把 a 移 进 文法 符号 栈 并 转向 状态 9。 

(2) 归 约 (Reduce)。 当 在 文法 符号 栈 项 形成 句柄 8 时 ， 把 8 归 约 为 相应 产生 式 4 一 8 的 非 
终结 符 4。 若 的 长 度 为 -( 即 B=r)， 则 弹出 文法 符号 栈 顶 的 + 个 符号 ,然后 将 4 压 入 文法 符 
号 栈 中 。 

(3) 接受 (Accept)。 当 文法 符号 栈 中 只 剩 下 文法 的 开始 符号 5S， 并 且 输 入 符号 串 已 经 结束 
时 (当前 输入 符 是 “#”)， 分 析 成 功 。 

(4) 报错 〈Error)。 当 输入 串 中 出 现 不 该 有 的 文法 符号 时 ， 就 报错 。 

LR 分 析 器 的 核心 部 分 是 分 析 表 的 构造 ， 这 里 不 再 详 述 。 


5. 语法 制导 翻译 和 中 间 代 码 生 成 


程序 语言 的 语义 分 为 静态 语义 和 动态 语义 。 描 述 程序 语义 的 形式 化 方法 主要 有 属性 文法 、 
公理 语义 、 操 作 语义 和 指称 语义 等 ， 其 中 属性 文法 是 对 上 下 文 无 关 文 法 的 扩充 。 目 前 应 用 最 广 
的 静态 语义 分 析 方法 是 语法 制导 翻译 ， 其 基本 思想 是 将 语言 结构 的 语义 以 属性 的 形式 赋予 代表 
此 结构 的 文法 符号 ， 而 属性 的 计算 以 语义 规则 的 形式 赋予 文法 的 产生 式 。 在 语法 分 析 的 推导 或 
归 约 的 步骤 中 ， 通 过 执行 语义 规则 实现 对 属性 的 计算 ， 以 实现 对 语义 的 处 理 。 

1) 中 间 代 码 

从 原理 上 讲 ， 对 源 程序 进行 语义 分 析 之 后 就 可 以 直接 生成 目标 代码 ， 但 由 于 源 程序 与 目标 
代码 的 逻辑 结构 往往 差别 很 大 ， 特 别 是 考虑 到 具体 机 器 指令 系统 的 特点 ， 要 使 翻译 一 次 到 位 很 
困难 ， 而 且 用 语法 制导 方式 机 械 生成 的 目标 代码 往往 是 烦琐 和 低 效 的 ， 因 此 有 必要 设计 一 种 中 
间 代 码 ， 将 源 程序 首先 翻译 成 中 间 代码 表示 形式 ， 以 利于 进行 与 机 器 无 关 的 优化 处 理 。 由 于 中 
间 代 码 实际 上 也 起 着 编译 器 前 端 和 后 端的 分 水 岭 作用 ， 所 以 使 用 中 间 代 码 也 有 助 于 提高 编译 程 
序 的 可 移植 性 。 常 用 的 中 间 代 码 有 后 缀 式 、 四 元 式 和 树 等 形式 。 

(1) 后 绥 式 〈 逆 波兰 式 )。 逆 波兰 式 是 波兰 逻辑 学 家 卢 卡 西 维 奇 (Lukasiewicz) 发 明 的 一 
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种 表示 表达 式 的 方法 。 这 种 表示 方式 把 运算 符 写 在 运算 对 象 的 后 面 ， 例 如 ， 把 atb 写成 ab+， 

所 以 也 称 为 后 缀 式 。 这 种 表示 法 的 优点 是 根据 运算 对 象 和 运算 符 的 出 现 次 序 进 行 计算 ， 不 需要 

使 用 括号 ， 也 便于 用 栈 实 现 求 值 。 对 于 表达 式 x:= (a 十 b) * (c 十 d)， 其 后 组 式 为 xab+cd+#:=。 
(2) 树 形 表示 。 例 如 ， 表 达 式 x:= (a 十 b) * 〈c 十 d) 的 树 形 表示 如 图 2-19 所 示 。 


人 
A 
+ 十 
is se 
d 


a b C 


x 


图 2-19 表达 式 的 树 形 表示 


(3) 四 元 式 表 示 。 四 元 式 是 一 种 普遍 采用 的 中 间 代码 形式 ， 其 组 成 成 分 为 运算 符 OP、 第 
一 运算 对 象 ARG1、 第 二 运算 对 象 ARG2 和 运算 结果 RESULT。 其 中 ， 运 算 对 象 和 运算 结果 有 
时 指 用 户 自 定义 的 变量 ， 有 时 指 编译 程序 引入 的 临时 变量 ，RESULT 总 是 一 个 新 引进 的 临时 变 
量 ， 用 来 存放 运算 结果 。 例 如 ， 表 达 式 x:= (a 十 b) * 〈c 十 d) 的 四 元 式 表示 为 ; 

@ (+ a, b, tl) ® +, ec dtb) @(ttb) 四 (= 3, _, x) 

2) 常见 语言 结构 的 翻译 

常见 的 程序 语言 结构 主要 有 算术 表达 式 、 布 尔 表达 式 、 赋 值 语句 和 控制 语句 (if、while) 
等 。 不 同 结构 需要 不 同 的 处 理 方法 ， 但 翻译 程序 的 构造 原理 是 相似 的 。 

对 于 各 种 语法 结构 的 语法 制导 翻译 ， 一 般 是 在 相应 的 语法 规则 中 加 入 适当 的 语义 处 理 ， 从 
而 在 对 程序 语句 进行 语法 分 析 过 程 中 的 恰当 时 机 同时 完成 语义 处 理 ， 实 现 语义 分 析 。 

例如 ， 将 语句 让 x<y then while a<b do a:=a+b 翻译 成 的 四 元 式 如 表 2-4 所 示 ， 其 中 2、4 两 
条 四 元 式 尚未 完全 确定 ， 有 待 于 回填 。 


表 2-4 预测 分 析 表 
说 了 明 
车 x<y， 则 转 第 3 条 
jj-,-,0) 否则 〈 即 x>y)， 转 向 地 址 待定 


若 as<b， 则 转 第 5 条 
否则 〈 即 azb)， 转 向 地 址 待定 
相 加 运算 : atb 的 结果 保存 为 革 
传 值 : 将 tl 的 值 传 给 a 

无 条 件 转移 至 第 三 条 


| G<,a,b,5) 
| G--0) 
(+,a,b,t1) 


说 | 和 lw 上 wp 一 
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3) 动态 存储 分 配 和 过 程 调用 的 翻译 

过 程 〈 函 数 ) 说 明和 过 程 〈 函 数 ) 调用 是 程序 中 一 种 常见 的 语法 结构 ， 绝 大 多 数 语言 都 含 
有 这 方面 的 内 容 。 过 程 说 明和 调用 语句 的 翻译 ， 有 赖 于 形 参 与 实 参 结合 的 方式 以 及 数据 空间 的 
分 配方 式 。 

由 于 各 种 语言 的 不 同 特点 ， 在 目标 程序 运行 时 ， 对 存储 空间 的 分 配 和 组 织 有 不 同 的 要 求 ， 
在 编译 阶段 应 产生 相应 的 目标 来 满足 不 同 的 要 求 。 需 要 分 配 存储 空间 的 对 象 有 基本 数据 类 型 
(如 整 型 、 实 型 和 布尔 型 等 )、 结 构 化 数据 类 型 (如 数组 和 记录 等 ) 和 连接 数据 〈 如 返回 地 址 、 
参数 等 )。 分 配 的 依据 是 名 字 的 作用 域 和 生存 期 的 定义 规则 。 分 配 的 策略 有 静态 存储 分 配 和 动 
态 存储 分 配 两 大 类 。 

如 果 在 编译 时 就 能 确定 目标 程序 运行 时 所 需 的 全 部 数据 空间 的 大 小 , 则 在 编译 时 就 安排 好 
目标 程序 运行 时 的 全 部 数据 空间 ， 并 确定 每 个 数据 对 象 的 存储 位 置 逻辑 地 址 )。 这 种 分 配 策 
略称 为 静态 存储 分 配 。Fortran 语言 的 早期 版 本 可 以 完全 采用 静态 存储 分 配 策略 。 

如 果 一 个 程序 语言 允许 递归 过 程 和 动态 可 变数 据 结构 ， 那 么 就 需 采 用 动态 存储 分 配 技术 。 
动态 存储 分 配 策略 的 实现 有 栈 分 配方 式 和 堆 分 配方 式 两 种 。 在 栈 式 动态 存储 分 配 中 ， 将 程序 的 
数据 空间 设计 为 一 个 栈 ， 每 当 调用 一 个 过 程 时 ， 它 所 需 的 数据 空间 就 分 配 在 栈 顶 ;每 当 过 程 执 
行 结束 时 ， 就 释放 这 部 分 空间 。 若 空间 的 使 用 未 必 服 从 “ 先 申请 后 释放 ”的 原则 ， 那 么 栈 式 的 
动态 存储 分 配方 式 就 不 适用 了 ， 这 种 情况 下 通常 使 用 堆 分 配 技 术 。 


6. 中间 代 码 优化 和 目标 代码 生成 


优化 就 是 对 程序 进行 等 价 变换 , 使 得 从 变换 后 的 程序 能 生成 更 有 效 的 目标 代码 。 所 谓 等 价 ， 
是 指 不 改变 程序 的 运行 结果 ;所谓 有 效 ， 是 指 目标 代码 运行 时 间 较 短 ， 占 用 的 存储 空间 较 少 。 
优化 可 在 编译 的 各 个 阶段 进行 。 最 主要 的 优化 是 在 目标 代码 生成 以 前 对 中 间 代 码 进行 的 ， 这 类 
优化 不 依赖 于 具体 的 计算 机 。 

目标 代码 的 生成 由 代码 生成 器 实现 。 代 码 生成 器 以 经 过 语义 分 析 或 优化 后 的 中 间 代 码 为 输 
入 ， 以 特定 的 机 器 语言 或 汇编 代码 为 输出 。 代 码 生 成 所 需 考虑 的 主要 问题 如 下 所 述 。 

(1) 中 间 代 码 形式 。 中 间 代 码 有 多 种 形式 ， 其 中 树 与 后 绥 表 示 形 式 适 用 于 解释 器 ， 而 编译 
器 多 采用 与 机 器 指令 格式 较 接近 的 四 元 式 形式 。 

(2) 目标 代码 形式 。 目 标 代 码 可 以 分 为 两 大 类 : 汇编 语言 形式 和 机 器 指令 形式 。 机 器 指令 
形式 的 目标 代码 又 可 以 根据 需求 的 不 同 分 为 绝对 机 器 指令 代码 和 可 再 定位 机 器 代码 。 绝 对 机 器 
代码 的 优点 是 可 以 立即 执行 , 一 般 应 用 于 一 类 称 为 load-and-go 形式 的 编译 模式 ， 即 编译 后 立即 
执行 ， 不 形成 保存 在 外 存 上 的 目标 代码 文件 。 可 再 定位 机 器 代码 的 优点 是 目标 代码 可 以 被 任意 
链接 并 装 入 内 存 的 任意 位 置 , 是 编译 器 采用 较 多 的 代码 形式 。 汇编 语言 作为 一 种 中 间 输 出 形式 ， 
便于 进行 分 析 和 测试 。 


互 
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(3) 寄存 器 的 分 配 。 由 于 访问 寄存 器 的 速度 远 快 于 访问 内 存单 元 的 速度 ， 所 以 总 是 希望 尽 


可 能 多 地 使 用 寄存 器 存储 数据 ， 而 寄存 器 的 个 数 是 有 限 的 ， 因 此 ， 如 何 分 配 及 使 用 寄存 器 ， 是 


目标 代码 生成 时 需要 着 重 考虑 的 。 


(4) 计算 次 序 的 选择 。 代 码 执行 的 效率 会 随 计算 次 序 的 不 同 有 较 大 的 差别 。 在 生成 正确 目 


标 代码 的 前 提 下 ， 适 当地 安排 计算 次 序 并 优化 代码 序列 ， 也 是 生成 目标 代码 时 要 考虑 的 重要 因 


素 之 一 。 


2.2.3 ”解释 程序 基本 原理 


解释 程序 是 另 一 种 语言 处 理 程序 ， 在 词法 、 语 法 和 语义 分 析 方面 与 编译 程序 的 工作 原理 基 


本 相同 ， 但 是 在 运行 用 户 程序 时 ， 它 直接 执行 源 程序 或 源 程序 的 中 间 表 示 。 因 此 ， 


解释 程序 不 


产生 源 程序 的 目标 程序 , 这 是 它 和 编译 程序 的 主要 区 别 。 图 2-20 显示 了 解释 程序 实现 高 级 语言 


的 三 种 方式 。 二 
源 程序 被 直接 解释 执行 的 处 理 方式 如 图 2-20 中 的 标记 | 
A 所 示 。 这 种 解释 程序 对 源 程 序 进行 逐个 字符 的 检查 ,进行 
词法 、 语 法 分 析 和 语义 分 析 后 就 执行 程序 语句 规定 的 动作 。 中 间 代 码 C 
例如 ， 如 果 扫描 到 符号 序列 A B 三 中 间 代 码 


GOTO L 


机 器 语言 


解释 程序 就 开始 搜索 源 程 序 中 标号 L 的 定义 位 置 ( 即 工 后 


源 程序 来 实现 程序 的 运行 ， 运 行 效 率 很 低 。 


而 紧 眼 冒号 “:” 的 语句 位 置 )。 这 类 解释 程序 通过 反复 扫描 。 图 2-20 解释 器 类 型 示意 图 


解释 程序 也 可 以 先 将 源 程序 翻译 成 某 种 中 间 代 码 形 式 , 然后 对 中 间 代 码 进行 解释 来 实现 用 


户 程 序 的 运行 ， 这 种 翻译 方式 如 图 2-20 中 的 标记 B 和 C 所 示 。 通 常 ， 在 中 间 代 码 和 高 级 语言 
的 语句 间 存在 一 一 对 应 的 关系 。APL 和 SNOBOL4 的 很 多 实现 就 采用 这 种 方法 。 解释 方式 B 和 
C 的 不 同 之 处 在 于 中 间 代 码 的 级 别 , 在 方式 C 下 , 解释 程序 采用 的 中 间 代码 更 接近 于 机 器 语言 。 
在 这 种 实现 方案 中 ， 高 级 语言 和 低级 中 间 代 码 间 存 在 着 1-n 的 对 应 关系 。PASCAL-P 解释 系统 
是 这 类 解释 程序 的 一 个 实例 ， 它 在 词法 分 析 、 语 法 分 析 和 语义 基础 上 ， 先 将 源 程序 翻译 成 P- 
代码 , 再 由 一 个 非常 简单 的 解释 程序 来 解释 执行 这 种 P- 代 码 。 这 类 系统 具有 比较 好 的 可 移植 性 。 


1. 解释 程序 的 基本 结构 


解释 程序 通常 可 以 分 成 两 部 分 : 第 一 部 分 是 分 析 部 分 ， 包 括 通常 的 词法 分 析 、 语 法 分 析 和 
语义 分 析 程 序 ， 经 语义 分 析 后 把 源 程 序 翻译 成 中 间 代码 ， 中 间 代 码 常 采用 逆 波 兰 表示 形式 。 第 


二 部 分 是 解释 部 分 ， 用 来 对 第 一 部 分 产生 的 中 间 代码 进行 解释 执行 。 下 面 简 要 介绍 第 二 部 分 的 
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工作 原理 。 
设 用 数组 MEM 模拟 计算 机 的 内 存 ， 源 程序 的 中 间 代 码 和 解释 部 分 的 各 个 子 程序 都 存放 在 

MEM 中 。 全 局 变量 PC 是 一 个 程序 计数 器 ， 它 记录 了 当前 正在 执行 的 中 间 代 码 的 位 置 。 这 种 解 

释 部 分 的 常见 结构 可 以 由 下 面 两 部 分 组 成 。 

(1) PC:=PC+1。 

(2) 执行 位 于 opcode-table[MEMI[IPC]] 的 子 程序 (解释 子 程序 执行 后 返回 到 前 面 )。 

下 面 用 一 个 简单 例子 来 说 明 其 工作 原理 。 设 两 个 实 型 变量 A 和 了 B 进行 相 加 的 中 间 代 码 是 : 


start: Ipush 
A 
Ipush 
B 
Iaddreal 


其 中 ， 中 间 代 码 Ipush 和 Iaddreal 实际 上 都 是 opcode-table 表 的 索引 值 ( 即 位 移 )， 而 该 表 
的 单元 中 存放 的 值 就 是 对 应 的 解释 子 程序 的 起 始 地 址 ，A 和 B 都 是 MEM 中 的 索引 值 。 解 释 部 
分 开始 执行 时 ，PC 的 值 为 start-1。 


opcode-table [Ipush]=push 
opcode-table[Iaddreal]=addreal 
解释 部 分 可 表示 如 下 : 
interpreter-loop: ”PC:=PC+1; 
goto opcode-table[MEM[PC]]; 
push: “PC:=PC+1; 
stackreal(MEM[MEMI[PC]]); 
goto interpreter-loop; 
addreal: stackreal(popreal()+popreal()); 


goto interpreter-loop; 


…【〔 其 余 各 解释 子 程序 ， 此 处 省 略 ) 


其 中 , stackreal0 表 示 把 相应 值 压 入 栈 中 , 而 popreal0 表 示 取 得 栈 项 元 素 值 并 弹出 栈 顶 元 素 。 
上 面 的 代码 基于 栈 实现 了 将 两 个 数值 相 加 并 将 结果 存 入 栈 中 的 处 理 。 


2. 编译 与 解释 方式 的 比较 
对 于 高 级 语言 的 编译 和 解释 工作 方式 ， 可 以 从 以 下 几 个 方面 进行 比较 。 
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(1) 效率 。 编 译 比 解释 方式 可 能 取得 更 高 的 效率 。 

一 般 情况 下 ， 在 解释 方式 下 运行 程序 时 ， 解 释 程 序 可 能 需要 反复 扫描 源 程序 。 例 如 ， 每 一 
次 引用 变量 都 要 进行 类 型 检查 ， 甚 至 需要 重新 进行 存储 分 配 ， 从 而 降低 了 程序 的 运行 速度 。 在 
空间 上 ， 以 解释 方式 运行 程序 需要 更 多 的 内 存 ， 因 为 系统 不 但 需要 为 用 户 程序 分 配 运行 空间 ， 
而 且 要 为 解释 程序 及 其 支撑 系统 分 配 空间 。 

在 编译 方式 下 ， 编 译 程序 除了 对 源 程序 进行 语法 和 语义 分 析 外 ， 还 要 生成 源 程序 的 目标 代 
码 并 进行 优化 ， 所 以 这 个 过 程 比 解释 方式 需要 更 多 的 时 间 。 虽 然 与 精心 设计 的 机 器 代码 程序 相 
比 ， 一 般 由 编译 程序 创建 的 目标 程序 运行 的 时 间 更 长 ， 需 要 占用 的 存储 空间 更 多 ， 但 源 程序 只 
需要 被 编译 程序 翻译 一 次 ， 就 可 以 多 次 运行 。 因 此 总 体 来 讲 ， 编 译 方式 比 解释 方式 可 能 取得 更 
高 的 效率 。 

(2) 灵活 性 。 由 于 解释 程序 需要 反复 检查 源 程 序 ， 这 也 使 得 解释 方式 能 够 比 编译 方式 更 灵 
活 。 当 解释 器 直接 运行 源 程序 时 ,“ 在 运行 中 ”修改 程序 就 成 为 可 能 ， 例 如 增加 语句 或 者 修改 
错误 等 。 另 外 ， 当 解释 器 直接 在 源 程序 上 工作 时 ， 它 可 以 对 错误 进行 更 精确 地 定位 。 

(3) 可 移植 性 。 解 释 器 一 般 也 是 用 某 种 程序 设计 语言 编写 的 ， 因 此 只 要 对 解释 器 进行 重新 
编译 ， 就 可 以 使 解释 器 运行 在 不 同 的 环境 中 。 
由 于 编译 和 解释 的 方法 各 有 特点 ， 因 此 现 有 的 一 些 编译 系统 既 提 供 编译 的 方式 ， 也 提供 解 
释 的 方式 ， 甚 至 将 两 种 方式 进行 结合 。 例 如 ， 在 Java 虚拟 机 上 发 展 出 的 compiling-just-in-time 
新 技术 ， 就 是 在 代码 第 一 次 运行 时 进行 编译 ， 在 其 后 的 运行 中 就 不 再 进行 编译 了 。 
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数据 结构 是 指数 据 元 素 的 集合 及 元 素 间 的 相互 关系 和 构造 方法 ， 结 构 就 是 元 素 之 间 的 关 
系 。 在 数据 结构 中 ， 元 素 之 间 的 相互 关系 是 数据 的 逻辑 结构 。 按 照 逻辑 关系 的 不 同 将 数据 结构 
分 为 线性 结构 和 非 线性 结构 ， 其 中 ， 线 性 结构 包括 线性 表 、 栈 、 队 列 、 串 ， 非 线性 结构 主要 包 
括 树 和 图 。 数 据 元 素 及 元 素 之 间 关 系 的 存储 形式 称 为 存储 结构 ， 可 分 为 顺序 存储 和 链接 存储 两 
种 基本 方式 。 

算法 与 数据 结构 密切 相关 ， 数据 结 构 是 算法 设计 的 基础 ， 合 理 的 数据 结构 可 使 算法 简单 而 
高 效 。 


3.1 线性 结构 


线性 结构 的 特点 是 数据 集合 中 的 元 素 之 间 是 一 种 线性 关系 ， 数 据 元 素 “ 一 个 接 一 个 地 排 
列 ”， 也 就 是 一 个 序列 。 


3.1.1 线性 表 


线性 表 是 指 一 个 序列 ， 常 采用 两 种 存储 方法 : 顺序 存储 和 链 式 存储 ， 主 要 的 操作 是 插入 、 
删除 和 查找 。 


1. 线性 表 的 定义 


一 个 线性 表 是 n 个 元 素 的 有 限 序列 (n>0)， 通 常 表示 为 《a1, a2,…, a,)， 其 特点 是 在 非 空 
的 线性 表 中 : 

(1) 存在 唯一 的 一 个 称 作 “第 一 个 ”的 元 素 。 

(2) 存在 唯一 的 一 个 称 作 “ 最 后 一 个 ”的 元 素 。 

(3) 除 第 一 个 元 素 外 ， 序 列 中 的 每 个 元 素 均 只 有 一 个 直接 前 驱 。 

(4) 除 最 后 一 个 元 素 外 ， 序 列 中 的 每 个 元 素 均 只 有 一 个 直接 后 继 。 


2. 线性 表 的 存储 结构 


1) 线性 表 的 顺序 存储 
线性 表 的 顺序 存储 是 指 用 一 组 地 址 连续 的 存储 单元 依次 存储 线性 表 中 的 数据 元 素 ， 从 而 使 
得 逻辑 上 相 邻 的 两 个 元 素 在 物理 位 置 上 也 相 邻 ， 如 图 3-1 所 示 。 在 这 种 存储 方式 下 ， 元 素 间 的 
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逻辑 关系 无 须 占 用 额外 的 空间 来 存储 。 


一 般 地 ， 以 LOC(ai) 表 示 线 性 表 中 第 一 个 元 素 的 存储 位 置 ， 工 a 
表示 每 个 元 素 所 占 空间 的 大 小 ， 则 顺序 存储 结构 中 ， 第 i 个 元 素 w ; 
的 存储 位 置 为 
LOC(a) = LOC(a)+(i1) XL 
线性 表 采 用 顺序 存储 结构 的 优点 是 可 以 随机 存 取 表 中 的 元 素 ， 
按 序号 查找 元 素 的 速度 很 快 。 缺 点 是 插入 和 删除 操作 需要 移动 元 


素 , 插入 元 素 前 要 移动 元 素 以 挪 出 空 的 存储 单元 , 然后 再 插入 元 素 ; 
删除 元 素 时 同样 需要 移动 元 素 ,以 填充 被 删除 的 元 素 空 出 来 的 存储 ” 图 3.1 线性 表 的 顺序 存储 
位 置 。 

在 表 长 为 的 线性 表 中 插入 新 元 素 时 ， 共 有 ntl 个 可 插入 位 置 ， 在 位 置 1 (元 素 al 所 在 位 
置 ) 插入 元 素 时 需要 移动 个 元 素 ， 在 位 置 n+1 元素 a, 所 在 位 置 之 后 ) 插入 元 素 时 不 需要 移 
动 元 素 ， 因 此 ， 等 概率 下 插入 一 个 元 素 时 平均 的 移动 元 素 次 数 Een 为 


n+l i nt+l n 
En = > PX(n-it+l))=— >》 (n-i+l)=— 
sen 之 3 ( ) rp =3 


其 中 ，P; 表 示 在 表 中 位 置 i 插入 元 素 的 概率 。 

在 表 长 为 n 的 线性 表 中 删除 元 素 时 ， 共 有 n 个 可 删除 的 元 素 ， 删 除 元 素 a 时 需要 移动 n-1 
个 元 素 ， 删除 元 素 a, 时 不 需要 移动 元 素 ， 因 此 ， 等 概率 下 删除 一 个 元 素 时 平均 的 移动 元 素 次 数 
Eeete 为 


本 、_ 1 已 、_7 一 1 
aaeee = 2 4 X(n-i) = 二 > (ni) -7 
I na 


其 中 ，g; 表 示 删 除 元 素 w 的 概率 。 

2) 线性 表 的 链 式 存储 

线性 表 的 链 式 存储 是 用 节点 来 存储 数据 元 素 ， 元 素 的 节点 地 址 可 以 连续 ， 也 可 以 不 连续 ， 
因此 ， 存 储 数据 元 素 的 同时 必须 存储 元 素 之 间 的 逻辑 关系 。 另 外 ， 节 点 空间 只 有 在 需要 的 时 候 
才 申 请 ， 无 须 事先 分 配 。 基 本 的 节点 结构 如 下 所 示 : 
数据 域 指针 域 


节点 中 的 数据 域 用 于 存储 数据 元 素 的 值 ， 指 针 域 则 存储 当前 元 素 的 直接 前 驱 或 直接 后 继 元 
素 的 位 置信 息 ， 指 针 域 中 所 存储 的 信息 称 为 指针 〈 或 链 )。 

nn 个 节点 通过 指针 连 成 一 个 链表 , 若 节点 中 只 有 一 个 指针 域 , 则 称 为 线性 链表 (或 单 链表 )， 
如 图 3-2 所 示 。 
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Head 一 一 | a lm = os —|a a —|a|^ 


(a) 不 含 头 节点 的 单 链 表 


Head 一 >| w al wa wo A | 可 | 人 
(b) 含 头 节点 的 单 链表 
图 3-2 线性 表 元 素 的 单 链表 存储 


在 链 式 存储 结构 中 , 只 需要 一 个 指针 ( 称 为 头 指针 , 如 图 3-2 中 的 Head) 指向 第 一 个 节点 ， 
就 可 以 按照 链接 关系 顺序 地 访问 表 中 的 任意 一 个 元 素 。 为 了 简化 对 链表 状态 的 判定 和 处 理 ， 特 
别 引入 一 个 不 存储 数据 元 素 的 节点 ， 称 为 头 节点 ， 将 其 作为 链表 的 第 一 个 节点 并 令 头 指针 指向 
在 链 式 存储 结构 下 进行 插入 和 删除 ， 其 实质 都 是 对 相关 指针 的 修改 。 
设 单 链表 节点 类 型 的 定义 为 : 


typedef struct node{ 
int data; /# 数 据 域 #/ 
struct node *next; /*# 指 针 域 #/ 
}NODE, *LinkList; 


在 单 链表 p 所 指 节点 (图 3-3 中 元 素 a 所 在 节点 ) 后 插入 新 元 素 节点 〈s 所 指 节 点 ， 图 
3-3 (a) 中 元 素 c 所 在 节点 ) 时 ， 操 作 如 下 。 
@s->next=p->next; 。 /*s 所 指 节 点 的 指针 域 改 为 指向 p 所 指 节 点 的 后 继 节 点 */ 


©@ p->next=s; /*p 所 指 节 点 的 指针 域 改 为 指向 s 所 指 节 点 */ 
p 
p Dg 
EE 
ee i Q | : C a 
EDGE RDE 
Fa C 十 - 
(a) 单 链表 中 插入 节点 (b) 单 链表 中 删除 节点 


3-3 ”在 单 链表 中 插入 和 删除 节点 时 的 指针 变化 示意 图 


在 单 链表 中 删除 p 所 指 节点 的 后 继 节 点 时 ， 操 作 如 下 。 

@ q=p->next; 雍 备 份 被 删除 节点 的 指针 */ 

@ p->next = p->next->next; 。”/* 修 改 节点 间 的 链接 关系 ， 从 链表 中 摘除 要 删除 的 节点 */ 
@®@ free(q); 性 释放 被 删除 节点 的 空间 */ 
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在 图 3-3 (b) 中 ， 若 需 删除 元 素 b， 则 令 p 节点 的 指针 域 指向 其 后 继 的 后 继 节点 〈 即 图 3-3 
Cb) 中 元 素 e 所 在 节点 )， 从 而 将 元 素 b 所 在 的 节点 从 链表 中 摘除 。 
F 面 给 出 单 链表 上 的 插入 和 删除 运算 的 实现 过 程 。 


【函数 】 单 链表 的 插入 运算 。 


int Insert_List (LinkList L, int k, int elem) /*L 为 带头 节点 单 链表 的 头 指针 */ 
人 # 将 elem 插入 表 L 的 第 k 个 元 素 之 前 〈 即 第 k-1 个 元 素 之 后 )， 若 成 功 则 返回 0， 否则 返回 -1*/ 
{ LinkListp,s; 。/*p 的 作用 是 指向 第 k-1 个 元 素 节点 ，s 则 指向 新 申请 的 节点 */ 


int i; 


i=0p=L; 人 # 初 始 时 ， 令 p 指 向 头 节点 ，i 为 元 素 个 数 计数 器 所 
人 # 顺 着 节点 的 链接 关系 依次 向 前 查找 ， 直 到 p 指向 第 k-1 个 元 素 节点 或 到 达 表 尾 */ 
while (p && i<k-1) { 

p=p->next; itt; 


} 
查找 结束 时 p 应 指向 第 k-1 个 元 素 所 在 节点 ， 若 不 存在 第 k-1 个 元 素 ， 则 p 为 空 指针 */ 
if (lp) return—l; 人 # 表 中 不 存在 第 k-1 个 元 素 ， 插 入 操作 失败 ， 返 回 */ 


/# 若 表 中 存在 第 k-1 个 元 素 ， 则 生成 新 元 素 的 节点 并 将 其 插入 第 k-1 个 元 素 之 后 */ 
s=(NODE *)malloc(sizeofNODE)); 


if (!s) return —1; 履 生 成 新 节点 操作 失败 ， 无 法 完成 插入 操作 ， 返 回 */ 
s->data = elem; 片 元 素 存 入 新 节点 的 数据 域 *#/ 

s->next=p->next; p->next=s; /* 新 节点 插入 第 k-l 个 元 素 节点 之 后 */ 

return 0; 


} /* Insert_List */ 
【函数 】 单 链表 的 删除 运算 。 


int Delete_List (LinkList L, int k) /4L 为 带头 节点 单 链表 的 头 指针 */ 
/# 删 除 表 中 的 第 k 个 元 素 节 点 ， 若 成 功 返 回 0， 否 则 返回 -1*/ 


{ LinkListp,q; /*p 的 作用 指向 待 删除 节点 的 前 驱 节点 ，q 指向 待 删除 的 节点 */ 
int i; 
/# 删 除 第 k 个 元 素 ， 需 要 将 第 k-1 个 元 素 节点 中 的 指针 域 改 为 指向 第 k+1 个 元 素 的 节点 */ 
i=0;p=L; /# 初 始 时 ， 令 p 指向 头 节点 ，i 为 元 素 个 数 计数 器 */ 


/# 顺 着 节点 的 链接 关系 依次 向 前 查找 ， 直 到 p 指向 第 k-1 个 元 素 节 点 或 到 达 表 尾 */ 
while (p && i<k-1) { 
p=p->next; it+; 


} 
人 查找 结束 时 p 应 指向 第 k-1 个 元 素 所 在 节点 ， 若 不 存在 第 k-l 个 元 素 ， 则 p 为 空 指针 */ 
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寺 (!p) return -1; /* 表 中 不 存在 第 k-1 个 元 素 ( 也 不 存在 第 k 个 元 素 )， 删 除 操作 失败 ， 返 回 */ 


if (!p->next) retum —1; 凡 表 中 不 存在 第 个 元 素 ， 删 除 操作 失败 ， 返 回 */ 
q = p->next; 人 # 令 q 指向 待 删除 的 第 k 个 元 素 节 点 */ 

p->next = q->next; free(q); 人 删除 节点 并 释放 节点 空间 所 

return 0; 


}/* Delete_List */ 


线性 表 采 用 链表 作为 存储 结构 时 ， 只 能 顺序 地 访问 元 素 ， 而 不 能 对 元 素 进行 随机 存 取 。 但 
其 优点 是 插入 和 删除 操作 不 需要 移动 元 素 。 
根据 节点 中 指针 信息 的 实现 方式 ， 还 有 双向 链表 、 循 环 链表 和 静态 链表 等 链表 结构 。 
。 ”双向 链表 : 每 个 节点 包含 两 个 指针 ， 分 别 指明 当前 元 素 的 直接 前 驱 和 直接 后 继 信息 ， 
可 在 两 个 方向 上 遍历 链表 中 的 元 素 。 
。 ”循环 链表 : 表 尾 节点 的 指针 指向 表 中 的 第 一 个 节点 ， 可 从 表 中 任意 节点 开始 遍历 整个 
链表 。 
。 ”静态 链表 : 借助 数组 来 描述 线性 表 的 链 式 存储 结构 。 
若 双 向 链表 中 节点 的 front 和 next 指针 域 分 别 指示 当前 节点 的 直接 前 驱 和 直接 后 继 ， 则 在 
双向 链表 中 插入 s 所 指 节点 时 相关 节点 的 指针 域 变化 情况 如 图 3-4 (a) 所 示 ， 其 操作 过 程 如 下 。 
@ s -> front=p -> front; 
@)p -> front -> next= S; /# 或 者 表示 为 s -> front -> next=s;*/ 
@p->front=s; 
@s->next=p; 
在 双向 链表 中 删除 p 所 指 节点 时 相关 节点 的 指针 域 变 化 情况 如 图 3-4 (b) 所 示 ， 其 操作 过 
程 如 下 。 
CD p -> front -> next = p -> next; 
@p -> next -> front =p -> front; 
© free(p); 


-=EIT 一 个. 


(a) 双向 链表 中 插入 节点 (b) 双向 链表 中 删除 节点 
图 3-4 双向 链表 中 插入 和 删除 节点 时 的 指针 变化 示意 图 


3， 线性 表 的 应 用 示例 
【 例 3.1】 选 首领 。 个 游戏 者 围 成 一 圈 ， 从 第 一 个 人 开始 顺序 报 数 1，2，3。 凡 报到 3 者 
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退出 圈子 ， 最 后 留 在 圈 中 的 人 为 首领 。 

N 个 游戏 者 围 成 的 圈 可 用 一 个 包含 N 个 节点 的 单 循环 链表 来 模拟 ，head 为 头 指针 ， 如 图 
3-5 (a) 所 示 ， 其 中 节点 的 数据 域 存放 游戏 者 的 编号 。 以 删除 节点 模拟 人 退出 圈子 的 处 理 ， 整 
型 变量 c〈 初 值 为 1) 用 于 计数 ， 指 针 变 量 p 的 初始 值 为 head。 运 行 时 ， 从 p 所 指向 的 节点 
始 计数 , p 沿 链表 中 的 指针 每 次 向 后 指 一 个 节点 , c 值 随 p 指针 的 移动 相应 地 递增 。 当 e 计数 到 
2 时 ， 就 删除 下 一 个 节点 〈 因 其 计数 值 将 等 于 3)， 如 图 3-5 (b) 所 示 ， 然 后 将 c 置 为 0， 为 下 
一 次 计数 做 准备 。 在 表 中 剩 下 最 后 一 个 节点 时 应 该 结束 游戏 ， 因 此 设置 一 个 计数 器 k， 其 初 值 
为 参加 游戏 的 人 数 。 每 当 删 除 一 个 节点 时 , k 值 就 减 1， 当 k 等 于 1 时 ( 即 圈 中 只 留 下 一 个 人 )， 
首领 就 选 出 来 了 。 


head 一 一 一 
| 


-|2| 


了 


村- 一 四 


(a) 单 循环 链表 模拟 N 个 游戏 者 围 成 的 圈 
c=2 


rie 4 一 加 


1 
二 
L_ 1 


(b) e 计数 到 2 时 ，p 所 指 节点 的 后 继 〈 下 一 个 游戏 者 ) 出 圈 
图 3-5 选 首领 问题 的 存储 结构 示意 图 


【函数 】 选 首领 。 
void play(LinkList head,int n) /* 选 首领 */ 
{ LinkList p,q; 

intc= 0, ki 


p=head;c=1; k=n; /# 当 初始 时 p 指向 第 1 个 游戏 者 ， 圈 中 有 个 游戏 者 */ 
while (k > 1){ 
让 (c==2) { 人 * 当 c 等 于 2 时 ，p 指向 的 节点 的 后 继 即 为 将 被 删除 的 节点 */ 
q=p->next; p->next = q->next; 
printf("%4d",q->data); free(q); 


c=0; k--; 
jxifwy 
else {c++; p= p->next;} 
}W/*while*/ 
printf("\n%4d was the winner.", p->data); /* 输 出 最 后 留 在 圈子 内 的 游戏 者 编号 */ 
free(p); 


Hi*play*/ 
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3.1.2” 栈 和 队列 


栈 和 队列 是 常用 的 两 种 数据 结构 ， 它 们 的 逻辑 结构 与 线性 表 相 同 。 其 特点 在 于 运算 受到 了 
限制 : 栈 按 “ 后 进 先 出 ”的 规则 进行 操作 ， 队 列 按 “ 先 进 先 出 ”的 规则 进行 操作 ， 故 称 运 算 受 
限 的 线性 表 。 


1. 栈 


1) 栈 的 定义 及 基本 运算 

(1) 栈 的 定义 。 

栈 是 只 能 通过 访问 它 的 一 端 来 实现 数据 存储 和 检索 的 一 种 线性 数据 结构 。 换 句 话说， 栈 的 
修改 是 按 先进 后 出 的 原则 进行 的 。 因 此 ， 栈 又 称 为 先进 后 出 《FILO) 或 后 进 先 出 (LIFO) 的 线 
性 表 。 在 栈 中 进行 插入 和 删除 操作 的 一 端 称 为 栈 项 (Top), 相应 地 , 另 一 端 称 为 栈 底 (Bottom)。 
不 含 数据 元 素 的 栈 称 为 空 栈 。 

(2) 栈 的 基本 运算 。 

@ 初始 化 栈 InitStack(S): 创建 一 个 空 栈 S。 

@ 判 栈 空 StackEmpty(S): 当 栈 $ 为 空 栈 时 返回 “ 真 ” 值 ， 和 否则 返回 “ 假 ” 值 。 

@ 入 栈 Push(S,x): 将 元 素 x 加 入 栈 顶 ， 并 更 新 栈 顶 指针 。 

@ 出 栈 Pop(S): 将 栈 顶 元 素 从 栈 中 删除 ， 并 更 新 栈 项 指针 。 若 需要 得 到 栈 顶 元 素 的 值 ， 
可 将 Pop(S) 定 义 为 一 个 函数 ， 它 返回 栈 顶 元 素 的 值 。 

@ 读 栈 项 元 素 Top(S): 返回 栈 顶 元 素 的 值 ， 但 不 修改 栈 项 指针 。 

2) 栈 的 存储 结构 

(1) 栈 的 顺序 存储 。 栈 的 顺序 存储 是 指 用 一 组 地 址 连续 的 存储 单元 依次 存储 自 栈 顶 到 栈 底 
的 数据 元 素 , 同时 附设 指针 top 指示 栈 顶 元 素 的 位 置 。 采用 顺序 存储 结 nent 
构 的 栈 也 称 为 顺序 栈 。 在 顺序 存储 方式 下 ， 需 要 预先 定义 或 申请 栈 的 “Eh 


存储 空间 ， 也 就 是 说 栈 空间 的 容量 是 有 限 的 。 因 此 在 顺序 栈 中 ， 当 一 
个 元 素 入 栈 时 ,需要 判断 是 否 栈 满 ( 栈 空间 中 没有 空闲 单元 )， 若 栈 满 ， | 
则 元 素 入 栈 会 发 生 上 溢 现 象 。 [CT^ ] 栈 底 
(2) 栈 的 链 式 存储 。 为 了 克服 顺序 存储 的 栈 可 能 存在 上 溢 的 不 足 ， ”图 3-6 链 栈 示意 图 
可 以 用 链表 存储 栈 中 的 元 素 。 用 链表 作为 存储 结构 的 栈 也 称 为 链 栈 。 由 于 栈 中 元 素 的 插入 和 删 
除 仅 在 栈 顶 一 端 进行 ,因此 不 必 设置 头 节点 ， 链表 的 头 指针 就 是 栈 顶 指针 。 链 栈 的 表示 如 图 3-6 
所 示 。 
3) 栈 的 应 用 
栈 的 典型 应 用 包括 表达 式 求 值 、 括 号 匹配 等 ， 在 计算 机 语言 的 实现 以 及 将 递归 过 程 转变 为 
非 递归 过 程 的 处 理 中 ， 栈 有 重要 的 作用 。 
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【 例 3.2】 表达 式 求 值 。 

计算 机 在 处 理 算术 表达 式 时 , 可 将 表达 式 先 转换 为 后 缀 形式 ,然后 利用 栈 进行 计算 。 例 如 ， 
表达 式 “46+5*(120-37)” 的 后 绥 表 达 式 形式 为 “46 5 120 37 一 * +”。 

计算 后 缀 表达 式 时 ， 从 左 至 右 扫描 后 缀 表达 式 : 若 遇 到 运算 对 象 ， 则 压 入 栈 中 ; 遇 到 运算 
符 ， 则 从 栈 中 弹出 相应 运算 对 象 进行 计算 ， 并 将 运算 结果 压 入 栈 中 。 重 复 以 上 过 程 ， 直 到 后 级 
表达 式 结束 。 例 如 ， 后 级 表达 式 “46 5 120 37 -* +” 的 计算 过 程 为 

(1) 依次 将 46、5、120、37 压 入 栈 中 。 

(2) 遇 到 “-”， 弹 出 37、120， 计 算 120-37， 得 83， 将 其 压 入 栈 中 。 

(3) 遇 到 “*?”， 弹 出 83、5， 计算 5*83， 得 415， 将 其 压 入 栈 中 。 

(4) 遇 到 “+” 弹出 415、46， 计 算 46+415， 得 461， 将 其 压 入 栈 中 。 

(5) 表达 式 结束 ， 则 计算 过 程 完成 。 

下 面 的 函数 computing(char expr[],int *resultb) 功 能 是 基于 栈 计算 后 绥 形 式 的 表达 式 〈 以 串 形 
式 存 入 字符 数组 expr) 的 值 ， 并 通过 参数 result 带 回 该 值 。 函 数 的 返回 值 为 -10， 分 别 表示 表 
达 式 有 /无 错误 。 假 设 表达 式 中 仅 包 含 数字 、 空 格 和 算术 运算 符号 ， 其 中 所 有 项 均 以 空格 分 隔 ， 
且 运 算 符 仅 包 含 加 (“+”)、 减 (“-”)、 乘 (“*”)、 除 (“\”)。 

栈 的 基本 操作 的 函数 原型 说 明 如 下 。 

void InitStack(STACK *s): 初始 化 栈 。 

void Push(STACK *s, int e): 将 一 个 整数 压 栈 ， 栈 中 元 素数 目 增 1 。 

void Pop(STACK *s): 栈 顶 元 素 出 栈 ， 栈 中 元 素数 目 减 1 。 


int Top(STACK s): 返回 非 空 栈 的 栈 顶 元 素 值 ， 栈 中 元 素数 目 不 变 。 
intIsEmpty(STACK s): 若 s 是 空 栈 ， 则 返回 1， 和 否则 返回 0。 


【函数 】 


int computing(char expr[], int *result) 
{ 
STACKs; inttnum,a,b; char *ptr; 


InitStack(&s); 
ptr = expr; 履 字符 指针 指向 后 级 表达 式 串 的 第 一 个 字符 */ 
while (*ptr!=\0") { 

if (ptr—") { 族 当 前 字符 是 空格 ， 则 取 下 一 字符 */ 


ptr++; continue; 

} 

else if(isdigit(*ptr)) { /# 当 前 字符 是 数字 ， 则 将 数字 串 转换 为 数值 专 
tnum = 0; 
while (*ptr>="0' && *ptr <="9°) { 


tnum = tnum * 10 + *ptr —"0°; 


第 3 章 数据 结构 与 算法 


ptrtt; 
} 
Push(&s,tnum); 
} 
else * 当 前 字符 是 运算 符 或 其 他 符号 */ 
站 ( *ptr 一 + 上 *ptr 一 "| *ptr 一 * | *ptr 一/ ){ /* 是 运算 符号 ， 取 运算 数 进行 相应 运算 */ 
if (!IsEmpty(s)) { 
a= Top(s); Pop(&s); /# 取 运算 符 的 第 二 个 运算 数 娄 
if (!IsEmpty(s)) { 
b= Top(s); Pop(&s); /* 取 运算 符 的 第 一 个 运算 数 #/ 
} 
else return—l; /# 缺 第 一 运算 数 #/ 
} 
else return—l; 目 缺 第 二 运算 数 */ 
switch (*ptr) { 
case '+': Push(&s,b+a); break; 
case '-': Push(&s,b-a); break; 
case *': Push(&s,b*a); break; 
case /: Push(&s,b/a); break; 
} 
} 
else return —l1; /# 是 其 他 符号 ， 无 法 运算 类 
ptrtt; 人 # 取 下 一 字符 村 
} /* while */ 
if (IsEmpty(s)) return -1; 
else { 
*result = Top(s); Pop(&s); /#* 取 运算 结果 所 
if (!IsEmpty(s)) return -1; 
return 0; 
} 
} 
2. 队列 


1) 队列 的 定义 及 基本 运算 
(1) 队列 的 定义 。 


加 :2 区 


队列 是 一 种 先进 先 出 (FIFO) 的 线性 表 ， 它 只 允许 在 表 的 一 端 插入 元 素 ， 而 在 表 的 另 一 端 
删除 元 素 。 在 队列 中 ， 人 允许 插入 元 素 的 一 端 称 为 队 尾 〈Rear)， 人 允许 删除 元 素 的 一 端 称 为 队 
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头 《Front)。 
(2) 队列 的 基本 运算 。 


@ 初始 化 队列 mitQueue(Q): 创建 一 个 空 的 队列 Q。 

@ 判 队 空 Empty(Q): 当 队 列 为 空 时 返回 “ 真 ” 值 ， 否 则 返回 “ 假 ” 值 。 
@ 入 队 EnQueue(Q,x): 将 元 素 x 加 入 到 队列 Q 的 队 尾 ， 并 更 新 队 尾 指针 。 
@ 出 队 DeQueue(Q): 将 队 头 元 素 从 队列 Q 中 删除 ， 并 更 新 队 头 指针 。 

加 读 队 头 元 素 FrontQueue(Q): 返回 队 头 元 素 的 值 ， 但 不 更 新 队 头 指针 。 


2) 队列 的 存储 结构 


(1) 队列 的 顺序 存储 。 队 列 的 顺序 存储 结构 又 称 为 顺序 队列 ， 它 也 是 利用 一 组 地 址 连续 的 
由 于 队 中 元 素 的 插入 和 删除 限定 在 表 的 两 端 进行 ， 因 此 设置 队 头 
指针 和 队 尾 指针 ， 分 别 指示 出 当前 的 队 首 元 素 和 队 尾 元 素 。 

设 顺 序 队列 Q 的 容量 为 6， 其 队 头 指针 为 front， 队 尾 指针 为 rear， 头 、 尾 指针 和 队列 中 元 


存储 单元 存放 队列 中 的 元 素 。 


素 之 间 的 关系 如 图 3-7 所 示 。 
一 一 4 Qrear 
5 EE 5 3 &6 
4 4 4 4| 6 
3 3 a- Q.rear 3 < Q.rear a e4 
2 2| 6 2 1 6 /< Qfront 2 _@ la Qfront 
1 1 e2 1 1 
0 |: en 0|_e J Qfront 0 ] 0 
(a) 空 队列 (b) e1、e2、@ 相 继 和 队 (ce) @1、 ez 相继 出 队 (qd) es、 es、e6 相 继 入 队 


图 3-7 队列 的 头 、 尾 指针 与 队列 中 元 素 之 间 的 关系 


在 顺序 队列 中 ， 为 了 简化 运算 ， 元 素 入 队 时 ， 只 修改 队 尾 指针 ， 元素 出 队 时 ， 只 修改 队 头 
指针 。 由 于 顺序 队列 的 存储 空间 是 提前 设 定 的 ， 因 此 队 尾 指针 会 有 一 个 上 限 值 ， 当 队 尾 指针 达 
到 其 上 限时 ， 就 不 能 只 通过 修改 队 尾 指针 来 实现 新 元 素 的 入 队 操 作 了 。 此 时 ， 可 将 顺序 队列 假 


想 成 一 个 环 状 结构 ， 如 图 3-8 所 示 ， 称 之 为 循环 队列 。 


e7 | e8 


Qifront (oR Q.rear 
4 


Q.rear 
一 


Q.front 


(b) 空 队列 (c) 队列 满 


图 3-8 循环 队列 的 头 、 尾 指针 示意 图 
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设 循环 队列 Q 的 容量 为 MAXSIZE， 初 始 时 队列 为 空 ， 且 Q.rear 和 Q.front 都 等 于 0， 如 图 
3-9 〈a) 所 示 。 元 素 入 队 时 修改 队 尾 指针 ， 即 令 Q.rear = (Q.rear+1)% MAXSIZE， 如 图 3-9 (b) 
所 示 。 元 素 出 队 时 修改 队 头 指针 ， 即 令 Q.front = (Q.front+1)% MAXSIZE， 如 图 3-9 (c) 所 示 。 

根据 出 队列 操作 的 定义 ， 当 出 队 操 作 导 致 队列 变 为 空 时 ， 有 Q.rear 一 Q.front， 如 图 3-9 (d) 
所 示 ; 车 队列 满 ， 则 Q.rear 一 Q.front， 如 图 3-9 (e) 所 示 。 在 队列 宝 和 队列 满 的 情况 下 ， 循 环 
队列 的 队 头 、 队 尾 指针 指向 的 位 置 是 相同 的 ,此 时 仅仅 根据 Q.rear 和 Q.front 之 间 的 关系 无 法 断 
定 队列 的 状态 。 为 了 区 分 队 空 和 队 满 的 情况 ， 可 采用 两 种 处 理 方式 : 其 一 是 设置 一 个 标志 位 ， 
以 区 别 头 、 尾 指针 的 值 相同 时 队列 是 空 还 是 满 ， 其 二 是 牺牲 一 个 元 素 空间 ， 约 定 以 “队列 的 尾 
指针 所 指 位 置 的 下 一 个 位 置 是 头 指针 ”表示 队列 满 ， 如 图 3-9 〈f) 所 示 ， 而 头 、 尾 指针 的 值 相 


同时 表示 队列 为 空 。 
Q.front 
e7 | e8 e7 
@ i . ) Q.rear & 
2 5 
4 4 


(a) 空 队列 (b) 元 素 ee、er、es 入 队列 后 《ce) 元 素 ee 出 队列 后 


Q.front 
Ce Qirear 
(d) 空 队列 (e) 队列 满 (f) 队列 满 
图 3-9 循环 队列 的 头 、 尾 指针 示意 图 
设 队列 中 的 元 素 类 型 为 整 型 ， 则 循环 队列 的 类 型 定义 为 : 


#define MAXQSIZE 100 
typedef struct { 


Q.rear 


Q.front 


int *base; 循环 队列 的 存储 空间 ， 假 设 队 列 元 素 类 型 为 整 型 */ 
int front, rear; 人 # 队 头 、 队 尾 指针 #/ 
}SqQueue; 


【函数 】 创 建 一 个 空 的 循环 队列 。 


int InitQueue(SqQueue *Q) 
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/# 创 建 容量 为 MAXQSIZE 的 空 队 列 ， 若 成 功 返 回 1; 否则 返回 0*/ 
{  Q->base= (int*)malloc(MAXQSIZE*sizeof(int)); 

if (1Q->base) return 0; 

Q->front = 0; Q->rear = 0; return 1; 
}/*InitQueue*/ 


【函数 】 元 素 入 循环 队列 。 


int EnQueue(SqQueue *Q, int e) /#* 元 素 e 入 队 ， 若 成 功 返 回 1; 否则 返回 0*/ 
{ if((Q->reartl)% MAXQSIZE 一 Q->fronb retum 0; 

Q->base[Q->rear] = e; 

Q->rear = (Q->rear + 1)% MAXQSIZE; 

return 1; 
}W*EnQueue*/ 


【函数 】 元 素 出 循环 队列 。 


int DeQueue(SqQueue *Q,int *e) 
作 若 队列 不 空 ， 则 删除 队 头 元 素 ， 由 参数 e 带 回 其 值 并 返回 1; 否则 返回 0*/ 
{ if(Q->rear 一 Q->front return 0; 
*e = Q->base[Q->front]; 
Q->front = (Q->front + 1) % MAXQSIZE ; 
return 1; data next 


}/*DeQueue*/ eA | 
(2) 队列 的 链 式 存储 。 队 列 的 链 式 存储 也 称 为 链 队 列 。 为 了 


便于 操作 ， 可 给 链 队列 添加 一 个 头 节点 ， 并 令 头 指针 指向 头 节点 ， Hp 

如 图 3-10 所 示 。 因 此 ， 队 列 为 空 的 判定 条 件 是 头 指针 和 尾 指针 的 | 

值 相同 ， 且 均 指 向 头 节点 。 L 
3) 队列 的 应 用 i 


的 打印 队列 、 离 散 事件 的 计算 机 模拟 等 


3.1 


队列 常用 于 处 理 需 要 排队 的 场合 , 如 操作 系统 中 处 理 打印 任务 


图 3-10 链 队 列 示意 图 


.3 串 
字符 串 是 一 串 文字 及 符号 的 简称 ， 是 一 种 特殊 的 线性 表 。 字 符 串 的 基本 数据 元 素 是 字符 ， 


计算 机 中 非 数值 问题 处 理 的 对 象 经 常 是 字符 串 数据 ， 如 在 汇编 和 高 级 语言 的 编译 程序 中 ， 源 程 


序 和 目标 程序 都 是 字符 串 数据 ; 在 事务 处 理 程序 中 , 姓名 、 地 址 等 一 般 也 是 作为 字符 串 处 理 的 。 


男儿 


站 ， 串 还 具有 自身 的 特性 ， 常 常 把 一 个 串 作 为 一 个 整体 来 处 理 。 这 里 简单 介绍 串 的 定义 、 基 
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本 运算 和 存储 结构 。 
1. 串 的 定义 及 基本 运算 


1) 串 的 定义 
串 是 仅 由 字符 构成 的 有 限 序 列 ， 是 取 值 范围 受 限 的 线性 表 。 一 般 记 为 S='a1a2…an'， 其 中 S 
是 串 名 ， 单 引号 括 起 来 的 字符 序列 是 串 值 。 
。 串 长 : 即 串 的 长 度 ， 指 字符 串 中 的 字符 个 数 。 
。 ， 空 串 ;长度 为 0 的 串 ， 空 串 不 包含 任何 字符 。 
。 ”空格 串 : 由 一 个 或 多 个 空格 组 成 的 串 。 虽 然 空 格 是 一 个 空白 符 ， 但 它 也 是 一 个 字符 ， 
计算 串 长 度 时 要 将 其 计算 在 内 。 
。 ” 子 申 : 由 串 中 任意 长 度 的 连续 字符 构成 的 序列 称 为 子 串 。 含 有 子 串 的 串 称 为 主 串 。 子 
串 在 主 串 中 的 位 置 指 子 串 首次 出 现时 , 该 子 串 的 第 一 个 字符 在 主 串 的 位 置 。 空 串 是 任 
意 串 的 子 串 。 
。 ” 串 相等 : 指 两 个 串 长 度 相等 且 对 应 位 置 上 的 字符 也 相同 。 
。 。 串 比 较 : 两 个 串 比 较 大 小 时 以 字符 的 ASCII 码 值 作为 依据 。 比 较 操作 从 两 个 串 的 第 一 
个 字符 开始 进行 字符 的 ASCII 码 值 大 者 所 在 的 串 为 大 ; 若 其 中 一 个 串 先 结束 ， 则 以 
串 长 较 大 者 为 大 。 
2) 串 的 基本 操作 
。 ”赋值 操作 StrAssign(s,D: 将 串 t 的 值 赋 给 串 s。 
。 连接 操作 Concat(s,t): 将 串 t 接 续 在 串 s 的 尾部 ， 形 成 一 个 新 串 。 
。 求 串 长 StrLength(s): 返回 串 s 的 长 度 。 
。 串 比较 StrCompare(s,D: 比较 两 个 串 的 大 小 。 返 回 值 -1、0 和 1 分 别 表 示 s<t、 s=t 和 
s>t 三 种 情况 。 
ee 求 子 串 SubString(s,startlen): 返回 串 s 中 从 start 开始 的 、 长 度 为 len 的 字符 序列 。 


2， 串 的 存储 结构 


字符 串 可 以 采用 顺序 存储 和 链 式 存储 方式 。 

(1) 顺序 存储 。 该 方式 是 用 一 组 地 址 连续 的 存储 单元 来 存储 串 值 的 字符 序列 。 由 于 串 中 的 
元 素 为 字符 ， 所 以 可 通过 程序 语言 提供 的 字符 数组 定义 串 的 存储 空间 〈 即 存储 空间 的 容量 固 
定 )， 也 可 以 根据 串 长 的 需要 动态 申请 字符 串 的 空间 〈 即 存储 空间 的 容量 可 扩充 或 缩减 )。 

(2) 链 式 存储 。 字 符 串 也 可 以 采用 链表 作为 存储 结构 ， 当 用 链表 存储 串 中 的 字符 时 ， 每 个 
节点 中 可 以 存储 一 个 字符 ， 也 可 以 存储 多 个 字符 ， 需 要 考虑 存储 密度 问题 。 节 点 大 小 为 4 的 块 
链 如 图 3-11 所 示 。 
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head 一 a | b cd| 才 -| g | h | 一 ij|#|l#|A 


图 3-11 串 值 的 链表 存储 方式 


在 链 式 存储 结构 中 ， 节 点 大 小 的 选择 与 顺序 存储 方法 中 数组 空间 大 小 的 选择 一 样 重 要 ， 它 
直接 影响 对 串 处 理 的 效率 。 

通常 情况 下 ， 字 符 串 存储 在 一 维 字符 数组 中 ， 每 个 字符 串 的 末尾 都 有 一 个 串 结束 符 ， 在 C 
语言 中 以 特殊 字符 “\0” 作 为 结束 标记 。 

3. 字符 串 运算 

大 多 数 的 程序 语言 在 其 开发 资源 包 中 都 提供 了 字符 串 的 赋值 《拷贝 )、 连 接 、 比 较 、 求 串 
长 、 求 子 串 等 基本 运算 ， 利 用 它们 就 可 以 实现 关于 串 的 其 他 运算 。 下 面 简要 介绍 求 串 长 和 串 比 


较 运 算 的 实现 。 
【函数 】 求 串 长 ， 即 计算 给 定 串 中 除 结束 标志 字符 \0' 之 外 的 字符 数目 。 


int strlen(char *s) 
{ 
int n= 0; 
while (s[n]!="\0’) 
nt+; 
retun n; 
}/*strlen*/ 


【函数 】 串 比较 。 

对 于 串 sl 和 s2, 比较 过 程 为 : 从 两 个 串 的 第 一 个 字符 开始 , 若 串 sl 和 s2 的 对 应 字符 相同 ， 
则 继续 比较 下 一 对 字符 ; 若 串 sl 的 对 应 字符 大 于 s2 的 相同 位 置 字符 ， 则 串 sl1 大 于 s2, 否则 sl 
小 于 s2。 返 回 值 0 表示 sl 和 s2 的 长 度 及 对 应 字符 完全 相同 ， 其 他 返回 值 则 表示 两 个 串 中 第 一 
个 不 同 字符 的 编码 差 值 。 


int strcmp(char *sl,char *s2) 
{ inti=0; 
while (s1[i]!=\0"| s2[]!=\0") { 
if(sl[i]==s2[i) it+t; 
else return sl[i] - s2[1]; 
} 
return 0; 
}/*stremp*/ 
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4.， 串 的 模式 匹配 


子 串 《也 称 为 模式 串 ) 在 主 串 中 的 定位 操作 通常 称 为 串 的 模式 匹配 ， 它 是 各 种 串 处 理 系统 
中 最 重要 的 运算 之 一 。 
1) 基本 的 模式 匹配 算法 
该 算法 也 称 为 布 鲁 特 - 福 斯 算法 ， 其 基本 思想 是 从 主 串 的 第 一 个 字符 起 与 模式 串 的 第 一 个 
字符 比较 ， 若 相等 ， 则 继续 逐个 字符 的 后 续 比 较 ， 否 则 从 主 串 的 第 二 个 字符 起 与 模式 串 的 第 一 
个 字符 重新 开始 比较 ， 直 至 模式 串 中 每 个 字符 依次 和 主 串 中 的 一 个 连续 的 字符 序列 相等 时 为 
止 ， 此 时 称 为 匹配 成 功 ， 否 则 称 为 匹配 失败 。 

【函数 】 以 字符 数组 存储 字符 串 ， 实 现 朴 素 的 模式 匹配 算法 。 


int Index(char S[], char T[], int pos) 
人 # 查 找 并 返回 模式 串 了 在 主 串 S 中 从 pos 开始 的 位 置 (下 标 )， 若 工 不 是 S 的 子 串 ， 则 返回 -1W 
{ ”i=pos;j=0; / 避 , j 分 别 用 于 指示 出 主 串 字符 和 模式 串 字符 的 位 置 (下 标 )*/ 
slen = strlen(S); tlen = strlen(T); /* 计 算 主 串 和 模式 串 的 长 度 */ 
while (i < slen && j < tlen) 
{ (SE] = TO) {ittijrt;} 
else 
{i= ij+l; 人 * 主 串 字 符 的 位 置 指针 回 退 */ 
j= 0; ”/* 模 式 串 重新 从 起 始 字符 开始 */ 
} 
} /*while*/ 
if(j >= tlen) 
return i— tlen; 
return 一 1; 
} /*Index*/ 


假设 主 串 的 长 度 为 x， 模式 串 的 长 度 为 m， 下 面 分 析 朴 素 模式 匹配 算法 的 时 间 复 杂 度 ， 位 
置 序号 从 1 开始 计算 。 设 从 主 串 的 第 i 个 位 置 开始 与 模式 串 匹 配 成 功 ， 而 在 前 六 1 趟 匹配 中 ， 
每 趟 不 成 功 的 匹配 都 是 模式 串 的 第 一 个 字符 与 主 串 中 相应 的 字符 不 相同 , 则 在 前 六 ! 趟 匹配 中 ， 
字符 的 比较 共 进行 了 计 1 次 ， 因 第 i 趟 成 功 匹 配 的 字符 比较 次 数 为 m， 所 以 总 的 字符 比较 次 数 
为 (i-1tm) 且 1<ign-m+1。 若 在 这 n-m+l 个 起 始 位 置 上 匹配 成 功 的 概率 相同 ， 则 在 最 好 情况 下 ， 
匹配 成 功 时 字符 间 的 平均 比较 次 数 为 


n—m+l 1 n—m+l 


, 要 2 -1 
> pi(i—-l+m)= > 1+ 四 = 了 0+ 站 


这 1 


因此 ， 在 最 好 情况 下 匹配 算法 的 时 间 复 杂 度 为 O(n+m)。 而 在 最 坏 的 情况 下， 每 一 趟 不 成 功 


n—m+l 
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的 匹配 都 是 模式 串 的 最 后 一 个 字符 与 主 串 中 相应 的 字符 不 相等 ， 则 主 串 中 新 一 趟 的 起 始 位 置 为 
im+2。 若 设 第 i 趟 匹配 时 成 功 ， 则 前 六 1 趟 不 成 功 的 匹配 中 ， 每 趟 都 比较 了 m 次 ， 总 共 比 较 了 
iXm 次 。 因 此 ， 最 坏 情 况 下 的 平均 比较 次 数 为 


nm+l nm+l] 


m 1 
(iXm)= 三 党 
Sr m) 二 这 了 PC+ 内 


由 于 n>>m， 所 以 该 算法 在 最 坏 情 况 下 的 时 间 复 杂 度 为 O(n X m)。 

2) 改进 的 模式 匹配 算法 

改进 的 模式 匹配 算法 又 称 为 KMP 算法 (由 D.E.Knuth、VR.Pratt 和 J.H.Morris 提出 )， 其 
改进 之 处 在 于 : 每 当 匹 配 过 程 中 出 现 相 比较 的 字符 不 相等 时 , 不 需要 回溯 主 串 字符 的 位 置 指针 ， 
而 是 利用 已 经 得 到 的 “部 分 匹配 ”的 结果 ， 将 模式 串 向 后 “滑动 ” 尽 可 能 远 的 距离 ， 再 继续 进 
行 比较 。 此 算法 可 在 O(ntm) 的 时 间 内 完成 。 


3.2 ”数组 和 矩阵 


数组 可 看 作 是 线性 表 的 推广 ， 其 特点 是 多 维 数组 的 数据 元 素 仍然 是 一 个 表 。 这 里 主要 介绍 
多 维 数组 的 逻辑 结构 和 存储 结构 、 特 殊 和 矩阵 和 矩阵 的 压缩 存储 。 


1， 数 组 


1) 数组 的 定义 及 基本 运算 

一 维 数组 是 长 度 固定 的 线性 表 ， 数 组 中 的 每 个 数据 元 素 类 型 相同 。7 维 数组 是 定 长 线性 表 
在 维 数 上 的 扩张 ， 即 线性 表 中 的 元 素 又 是 一 个 线性 表 。 

设 及 n 维 数组 4[b1,b,…,b,]， 其 每 一 维 的 下 界 都 为 1，bi 是 第 i 维 的 上 界 。 从 数据 结构 的 逻 
辑 关 系 角度 来 看 ，4 中 的 每 个 元 素 4[j, jp,，…,jn](1Sj<bi) 都 被 n 个 关系 所 约束 。 在 每 个 关系 中 ， 
除 第 一 个 和 最 后 一 个 元 素 外 ， 其 余 元 素 都 只 有 一 个 直接 后 继 和 一 个 直接 前 驱 。 因 此 就 单个 关系 
而 言 ， 这 个 关系 仍 是 线性 的 。 

以 下 面 的 二 维 数组 4[m][n] 为 例 ， 可 以 把 它 看 成 是 一 个 定 长 的 线性 表 ， 它 的 每 个 元 素 也 是 


一 个 定 长 线性 表 。 
Od ga dm an 
A 
Gm Gm2 Gn Gmn 


可 将 4 看 作 一 个 行 向 量 形式 的 线性 表 : 
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4 =[[anaz an J[02102» ga] [Am am …am]] 

也 可 将 4 看 作 列 向 量 形式 的 线性 表 : 
dm =[[anez …am][aaza A …am]] 
数组 结构 的 特点 如 下 。 
(1) 数据 元 素数 目 固定 。 一 旦 定义 了 一 个 数组 结构 ， 就 不 再 有 元 素 的 增 减 变化 。 
(2) 数据 元 素 具 有 相同 的 类 型 。 
(3) 数据 元 素 的 下 标 关 系 具有 上 下 界 的 约束 且 下 标 有 序 。 
在 数组 中 通常 做 下 面 两 种 操作 。 
(1) 取 值 操作 。 给 定 一 组 下 标 ， 读 取 对 应 的 数据 元 素 。 
(2) 赋值 操作 。 给 定 一 组 下 标 ， 存 储 或 修改 与 其 相对 应 的 数据 元 素 。 
几乎 所 有 的 程序 设计 语言 都 提供 了 数组 类 型 。 实 际 上 ,在 语言 中 把 数组 看 成 是 具有 共同 名 
字 的 同一 类 型 多 个 变量 的 集合 。 需 要 注意 的 是 ， 不 能 对 数组 进行 整体 的 运算 ， 只 能 对 单个 数组 
元 素 进行 运算 。 
2) 数组 的 顺序 存储 
由 于 数组 一 般 不 作 插入 和 删除 运算 ， 也 就 是 说 ， 一 旦 定义 了 数组 ， 则 结构 中 的 数据 元 素 个 
数 和 元 素 之 间 的 关系 就 不 再 发 生变 动 ， 因 此 数组 适合 于 采用 顺序 存储 结构 。 

对 于 数组 ， 一 旦 确定 了 它 的 维 数 和 各 维 的 长 度 ， 便 可 为 它 分 配 存储 空间 。 反 之 ， 只 要 给 出 
一 组 下 标 便 可 求 得 相应 数组 元 素 的 存储 位 置 ， 也 就 是 说 ， 在 数据 的 顺序 存储 结构 中 ， 数 据 元 素 
的 位 置 是 其 下 标的 线性 函数 。 

二 维 数组 的 存储 结构 可 分 为 以 行为 主 序 ( 按 行 存储 ) 和 以 列 为 主 序 ( 按 列 存储 ) 两 种 方法 ， 
如 图 3-12 所 示 。 


第 一 行 1 r 第 一 列 
第 = 行 1 | 
第 m 行 第 n 列 


图 3-12 二 维 数组 的 两 种 存储 方式 
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设 每 个 数据 元 素 占用 工 个 单元 ，m、n 为 数组 的 行 数 和 列 数 ， 那 么 以 行为 主 序 优先 存储 的 
地 址 计算 公式 为 


Loc(a,)=Loc(a)+(G—DXn+0-1)XL 


同 理 ， 以 列 为 主 序 优先 存储 的 地 址 计算 公式 为 
Loc(w)= Loc(a)+(0 -1D) Xm+(i-1)XL 


2， 和 矩阵 


矩阵 是 很 多 科学 与 工程 计算 问题 中 研究 的 数学 对 象 。 在 数据 结构 中 主要 讨论 如 何在 尽 可 能 
节省 存储 空间 的 情况 下 ， 使 矩阵 的 各 种 运算 能 高 效 地 进行 。 

在 一 些 和 矩阵 中 ， 存 在 很 多 值 相同 的 元 素 或 者 是 零 元 素 。 为 了 节省 存储 空间 ， 可 以 对 这 类 和 矩 
阵 进 行 压 缩 存储 。 压 缩 存 储 的 含义 是 为 多 个 值 相同 的 元 素 只 分 配 一 个 存储 单元 ， 对 零 元 素 不 分 
配 存储 单元 。 

1) 特殊 矩阵 

常见 的 特殊 矩阵 有 对 称 和 矩阵、 三 角 和 矩阵 和 对 角 和 矩阵 等 。 对 于 特殊 矩阵 ， 由 于 其 非 零 元 素 的 
分 布 都 有 一 定 的 规律 ， 所 以 可 将 其 压缩 存储 在 一 维 数组 中 ， 并 建立 起 每 个 非 零 元 素 在 矩阵 中 的 
位 置 与 其 在 一 维 数组 中 的 位 置 之 间 的 对 应 关系 。 

车 矩阵 4,xn 中 的 元 素 有 ay = or 1<i,j<n) 的 特点 ， 则 称 之 为 对 称 矩 阵 。 

若 为 对 称 矩 阵 中 的 每 一 对 元 素 分 配 一 个 存储 单元 , 那么 就 可 将 好 个 元 素 压缩 存储 到 能 存放 
n(n+1)/2 个 元 素 的 存储 空间 中 。 不 失 一 般 性 ， 以 行为 主 序 存储 下 三 角 (包括 对 角 线 ) 中 的 元 素 。 
假设 以 一 维 数组 B[n(n+1)/2] 作 为 n 阶 对 称 和 矩阵 4 中 元 素 的 存储 空间 ， 则 B[ 和 (0<k<n(n+1)/2) 
与 矩阵 元 素 ay (qj) 之 间 存 在 着 一 一 对 应 的 关系 。 

D+-1 当 i>j 
和 201 
2 

对 角 和 矩阵 是 指 矩阵 中 的 非 零 元 素 都 集中 在 以 主 对 角 线 为 中 心 的 带 状 区 域 中 , 即 除了 主 对 角 
线 上 和 直接 在 对 角 线 上 、 下 方 若 干 条 对 角 线 上 的 元 素 外 ， 其 余 的 和 矩阵 元 素 都 为 零 。 一 个 n 阶 的 
三 对 角 和 矩阵 如 图 3-13 所 示 。 

若 以 行为 主 序 将 n 阶 三 对 角 和 矩阵 4,x 的 非 零 元 素 存储 在 一 维 数组 B[IAJ(0<sk<3Xn-2) 中 , 则 
元 素 位 置 之 间 的 对 应 关系 为 

k=3 XD)-1l+j-itl=2i+j-3 (lI<ij<n) 
其 他 特殊 矩阵 可 作 类 似 的 推导 和 计算 ， 这 里 不 再 一 一 说 明 。 


i<j 
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2) 稀疏 矩阵 

在 一 个 矩阵 中 ， 若 非 零 元 素 的 个 数 远 远 少 于 零 元 素 的 个 数 ， 且 非 零 元 素 的 分 布 没 有 规律 ， 
则 称 之 为 稀 朴 矩阵 。 

对 于 稀疏 矩阵， 存储 非 零 元 素 时 必须 同时 存储 其 位 置 〈 即 行 号 和 列 号 )， 所 以 三 元 组 (iy,ay) 
可 唯一 确定 矩阵 中 的 一 个 元 素 。 由 此 ， 一 个 稀疏 矩阵 可 由 表示 非 零 元 素 的 三 元 组 及 其 行 、 列 数 
唯一 确定 。 

一 个 6 行 7 列 的 稀疏 矩阵 如 图 3-14 所 示 ， 其 三 元 组 表 为 ((1,2,12),(1,3,9),(3,1,-3),(3,6,14)， 
(4,3,24), (5,2,18),(6,1,15),(6,4,—7))。 


[a a | 
qo a qzs 0 To 12 ooo 0 | 
G32 qd33 ld34 0 0 0 0 0 0 0 
A ji 二 二 -3 0 0 0 0 14 0 
al ai oo 24 0 0 0 0 
M 0 18 0 0 0 0 0 
L nml Qnrn | 15 0 0 -7 0 0 0 
图 3-13 ”三 对 角 和 矩阵 示意 图 图 3-14 稀疏 矩阵 示意 图 
稀疏 矩阵 的 三 元 组 表 构 成 一 个 线性 表 ， 其 顺序 存储 结构 称 为 三 元 组 顺序 表 ， 其 链 式 存储 结 


构 称 为 十 字 链 表 。 


3.3 ” 树 和 图 


3.3.1 树 


树 结构 是 一 种 非常 重要 的 非 线性 结构 ,该 结构 中 一 个 数据 元 素 可 以 有 两 个 或 两 个 以 上 的 直 
接 后 继 元 素 ， 可 以 用 来 描述 客观 世界 中 广泛 存在 的 层次 关系 。 


1. 树 的 定义 
树 是 n(n>0) 个 节点 的 有 限 集合 。 当 n=0 时 称 为 空 树 。 在 任 一 非 空 树 (n>0) 中 ， 有 且 仅 有 


一 个 称 为 根 的 节点 ， 其 余 节 点 可 分 为 m(m>0) 个 互 不 相交 的 有 限 集 Ti, PP，…, 7Tm， 其 中 每 个 集 
合 又 都 是 一 棵 树 ， 并 且 称 为 根 节点 的 子 树 。 
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树 的 定义 是 递归 的 ， 它 表明 了 树 本 身 的 固有 特性 ， 也 就 是 一 棵 树 由 若干 棵 子 树 构成 ， 而 子 


树 又 


更 小 的 子 树 构成 。 该 定义 只 给 出 了 树 的 组 成 特点 ， 若 从 数据 结构 的 逻辑 关系 角度 来 看 ， 


树 中 元 素 之 间 有 明显 的 层次 关系 。 对 树 中 的 某 个 节点 ， 它 最 多 只 和 上 一 层 的 一 个 节点 〈 即 其 双 
亲 节 点 ) 有 直接 关系 ， 而 与 其 下 一 层 的 多 个 节点 〈 即 其 子 树 节点 ) 有 直接 关系 , 如 图 3-15 所 示 。 


通常 ， 


2. 


凡是 分 等 级 的 分 类 方案 都 可 以 用 具有 严格 层次 关系 的 树 结构 来 描述 。 
@@ 


B® © © 
©®DYO 


图 3-15 树 结构 示意 图 


双亲 、 孩 子 和 兄弟 : 节点 的 子 树 的 根 称 为 该 节点 的 孩子 ， 相 应 地 ， 该 节点 称 为 其 子 节 
点 的 双亲 。 具 有 相同 双亲 的 节点 互 为 兄弟 。 例 如 ， 图 3-15 中 ， 节 点 A 是 树 根 ，B、C、 
D 是 A 的 孩子 节点 ，B、C、D 互 为 兄弟 ; B 是 E、F 的 双亲 ，E、F 互 为 兄弟 。 

节点 的 度 : 一 个 节点 的 子 树 的 个 数 记 为 该 节点 的 度 。 例 如 ， 图 3-15 中 ，A 的 度 为 3， 
B 的 度 为 2，C 的 度 为 0，D 的 度 为 1。 

叶子 节点 : 也 称 为 终端 节点 ， 指 度 为 零 的 节点 。 例 如 ， 图 3-15 中 ，E、F、C、G 都 是 
叶子 节点 。 

内 部 节点 : 度 不 为 零 的 节点 称 为 分 支 节点 或 非 终 端 节点 。 除 根 节点 之 外 ， 分 支 节点 也 
称 为 内 部 节点 。 例 如 ， 图 3-15 中 ，B、D 都 是 内 部 节点 。 

节点 的 层次 : 根 为 第 一 层 ， 根 的 孩子 为 第 二 层 。 以 此 类 推 ， 若 某 节点 在 第 i 层 ， 则 其 
孩子 节点 就 在 第 itl 层 。 例如， 图 3-15 中 ，A 在 第 1 层 ，B、C、 DD 在 第 2 层 , E、F 
和 G 在 第 3 层 。 

树 的 高 度 : 一 棵 树 的 最 大 层次 数 记 为 树 的 高 度 〔 或 深度 )。 例 如 ， 图 3-15 所 示 树 的 高 
度 为 3。 

有 序 〈 无 序 ) 树 : 若 将 树 中 节点 的 各 子 树 看 成 是 从 左 到 右 具 有 次 序 的 ， 即 不 能 交换 ， 
则 称 该 树 为 有 序 树 ， 否 则 称 为 无 序 树 。 

森林 : m(m>0) 棵 互 不 相交 的 树 的 集合 。 


二 又 树 的 定义 


二 又 树 是 n(n>0) 个 节点 的 有 限 集合 ， 它 或 者 是 空 树 (n=0), 或 者 是 由 一 个 根 节点 及 两 棵 不 
相交 的 、 分 别称 为 左 子 树 和 右 子 树 的 二 又 树 所 组 成 。 
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尽管 树 和 二 又 树 的 概念 之 间 有 许多 联系 , 但 它们 有 区 别 。 树 和 二 又 树 之 间 最 主要 的 区 别 是 : 
二 又 树 中 节点 的 子 树 要 区 分 左 子 树 和 右 子 树 ， 即 使 在 节点 只 有 一 棵 子 树 的 情况 下 也 要 明确 指出 
该 子 树 是 左 子 树 还 是 右 子 树 ， 树 中 则 不 区 分 ， 如 图 3-16 所 示 。 另 外 ， 二 又 树 中 节点 的 最 大 度 为 
2， 而 树 中 不 限制 节点 的 度数 。 


QO 心 心 
@) (©O ORG @®) (©O 
©) © 
(b) 二 叉 树 中 结 点 B C6) 二叉树 中 结 点 B 的 。 Cd) 普通 树 中 结 点 
的 左 子 村 为 空 右 子 树 为 空 B 有 一 棵 子 桂 


图 3-16 二 又 树 与 普通 树 


3. 二 又 树 的 性 质 


性 质 1: 二 又 树 第 i 层 (这 1) 上 至 多 有 2 站 个 节点 。 

可 用 归纳 法 证 明 性 质 1。 

性 质 2: 深度 为 的 二 叉 树 至 多 有 2-1 个 节点 ( 记 1)。 
大 

由 性 质 1， 每 一 层 的 节点 数 都 取 最 大 值 即 得 > 2" =2* -1， 因 此 性 质 2 得 证 。 
1=1 


性 质 3: 对 任何 一 棵 二 又 树 ， 若 其 终端 节点 数 为 mw， 度 为 2 的 节点 数 为 二， 则 no=n2+1。 

对 二 叉 树 中 节点 的 度 求 总 和 也 就 是 分 支 的 数目 , 而 二 叉 树 中 节点 总 数 恰好 比分 支 数目 多 1， 
此 性 质 3 得 证 。 

性 质 4: 具有 nn 个 节点 的 完全 二 叉 树 的 深度 为 | logsn |+1。 

车 深度 为 的 二 叉 树 有 2 和 -1 个 节点 , 则 称 其 为 满 二 又 树 。 可 以 对 满 二 又 树 中 的 节点 进行 连 
续 编号 ， 约 定编 号 从 根 节点 起 ， 自 上 而 下 、 自 左 至 右 依次 进行 。 即 根 节点 的 编号 为 1， 其 左 孩 
子 节点 编号 为 2， 右 孩子 节点 编号 为 3， 以 此 类 推 , 编号 为 i 的 节点 的 左 孩 子 编号 为 2i、 右 孩子 
编号 为 2i+1。 

当 深 度 为 k、 及 n 个 节点 的 二 叉 树 ， 当 且 仅 当 其 每 一 个 节点 都 与 深度 为 的 满 二 叉 树 中 编 
号 为 1~n 的 节点 一 一 对 应 时 , 称 之 为 完全 二 又 树 。 高 度 为 3 的 满 二 又 树 和 完全 二 又 树 如 图 3-17 
(a) 一 〈d) 所 示 ， 显 然 ， 满 二 叉 树 也 是 完全 二 又 树 。 


四 
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(a) 满 二 叉 树 (b) 完全 二 又 树 (c) 完全 二 叉 树 (d) 完全 二 又 树 


图 3-17 满 二 又 树 和 完全 二 又 树 示 意图 


在 一 个 高 度 为 h 的 完全 二 又 树 中 ,除了 第 h 层 ( 即 最 后 一 层 )， 其 余 各 层 都 是 满 的 。 在 第 有 
层 上 的 节点 必须 从 左 到 右 依次 放置 , 不 能 留 空 。 图 3-18 所 示 的 高 度 为 3 的 二 又 树 都 不 是 完全 二 
又 树 ， 其 中 ，(a) 中 4 号 节点 、(b) 中 5 号 节点 、(c) 中 6 号 节点 的 左边 有 空 节点 。 


© OD OQ 
©® 93 BO a @ 四 
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(a) (b) 


(c) 


图 3-18 非 完全 二 又 树 
显然 ， 具有 nn 个 节点 的 完全 二 叉 树 的 高 度 为 [logsn |+1。 


4. 二 又 树 的 存储 结构 


二 又 树 的 顺序 存储 结构 
一 组 地 址 连续 的 存储 单元 存储 二 叉 树 中 的 节点 ， 必 须 把 节点 排 成 一 个 适当 的 线性 序列 ， 
并 且 节 点 在 这 个 序列 中 的 相互 位 置 能 反映 出 节点 之 间 的 逻辑 关系 对 于 深度 为 上 的 完全 二 又 树 ， 
除 第 下层 外 ， 其 余 各 层 中 含有 最 大 的 节点 数 ， 即 每 一 层 的 节点 数 恰 为 其 上 一 层 节点 数 的 两 倍 ， 
由 此 从 一 个 节点 的 编号 可 推 知 其 双亲 、 左 孩子 和 右 孩 子 的 编号 。 

假设 有 编号 为 i 的 节点 ， 则 有 : 

。 若 关 1， 则 该 节点 为 根 节 点 ， 无 双亲 ; 若 疡 1， 则 该 节点 的 双亲 节点 为 [1/2|。 

。 若 2ign， 则 该 节点 的 左 孩子 编号 为 2?， 否 则 无 左 孩子 。 

。 若 2it1gn， 则 该 节点 的 右 孩 子 编号 为 2i+1， 否 则 无 右 孩 子 。 

完全 二 又 树 的 顺序 存储 结构 如 图 3-19(a》 所 示 。 

显然 ， 顺 序 存储 结构 对 完全 二 又 树 而 言 既 简单 又 节省 空间 ， 而 对 于 一 般 二 叉 树 则 不 适用 。 
因为 在 顺序 存储 结构 中 ， 以 节点 在 存储 单元 中 的 位 置 来 表示 节点 之 间 的 关系 ， 那 么 对 于 一 般 的 
二 叉 树 来 说 , 也 必须 按照 完全 二 又 树 的 形式 存储 , 也 就 是 要 添上 一 些 实际 并 不 存在 的 “ 虚 节 点 ”， 
这 将 造成 空间 的 浪费 ， 如 图 3-19 (b) 所 示 。 


1 


_ 
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完全 二 又 树 一 般 二 叉 树 


1 2345678910 1 2345678910 
Alnlclnlelr[aln A|alzlcls|lslsls|p| 
(a) (b) 

图 3-19 ”二叉树 的 顺序 存储 结构 

在 最 坏 的 情况 下 ， 一 个 深度 为 h 且 只 有 hh 个 节点 的 二 叉 树 ( 单 枝 树 ) 却 需要 2 和 -1 个 存储 
单元 。 

2) 二 又 树 的 链 式 存储 结构 

由 于 二 叉 树 中 节点 包含 有 数据 元 素 、 左 子 树 根 、 右 子 树 根 及 双亲 等 信息 ， 因 此 可 以 用 三 又 


链表 或 二 又 链表 〈 即 一 个 节点 含有 三 个 指针 或 两 个 指针 ) 来 存储 二 叉 树 ， 链 表 的 头 指针 指向 二 
叉 树 的 根 节点 ， 如 图 3-20 所 示 。 


图 3-20 二 又 树 的 链表 存储 结构 
设 节 点 中 的 数据 元 素 为 整 型 ， 则 二 又 链 表 的 节点 类 型 定义 如 下 : 
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typedef struct BiTnode{ 

int ”data; 人 # 节 点 的 数据 域 #/ 

struct BiTnode *lchild,*rchild; /# 左 孩子 、 右 孩子 指针 域 #/ 
}BiTnode,*BiTree; 


5. 二 叉 树 的 人 遍历 


遍历 是 按 某 种 策略 访问 树 中 的 每 个 节点 ， 且 仅 访 问 一 次 。 

由 于 二 又 树 所 具有 的 递归 性 质 ， 一 棵 非 空 的 二 又 树 可 以 看 作 是 由 根 节点 、 左 子 树 和 右 子 树 
三 部 分 构成 ， 因 此 若 能 依次 遍历 这 三 个 部 分 的 信息 ， 也 就 遍历 了 整 棵 二 又 树 。 按 照 遍历 左 子 树 
要 在 遍历 右 子 树 之 前 进行 的 约定 ， 依 据 访 问 根 节 点 位 置 的 不 同 ， 可 得 到 二 又 树 的 前 序 、 中 序 和 
后 序 三 种 遍历 方法 。 

中 序 遍 历 二 又 树 的 操作 定义 如 下 。 若 二 又 树 为 空 ， 则 进行 空 操 作 。 否 则 : 

(1) 中 序 遍历 根 的 左 子 树 。 

(2) 访问 根 节点 。 

(3) 中 序 遍历 根 的 右 子 树 。 

【函数 】 二 又 树 的 中 序 遍 历 算法 。 


void InOrder(BiTree root) 


{if(root=— NULL) retum; 放空 树 */ 
else { InOrder(root->lchild); /# 中 序 遍历 根 节点 的 左 子 树 #/ 
printft“%d”,root->data); /# 访 问 根 节 点 科 
InOrder(root->rchild); 上 中 序 遍历 根 节点 的 右 子 树 */ 
Jsifw 


HW/*InOrder*/ 


实际 上 , 将 中 序 遍 历 算法 中 对 根 节点 的 访问 操作 放 在 左 子 树 的 遍历 之 前 或 右 子 树 的 遍历 之 
后 ， 就 分 别 得 到 先 序 遍 历 和 后 序 遍 历 算法 。 人 遍历 二 叉 树 的 过 程 实质 上 是 按 一 定 规则 ， 将 树 中 的 
节点 排 成 一 个 线性 序列 的 过 程 。 

遍历 二 又 树 的 基本 操作 就 是 访问 节点 , 不 论 按 照 哪 种 次 序 遍 历 , 对 含有 nn 个 节点 的 二 又 树 ， 
遍历 算法 的 时 间 复 杂 度 都 为 O(n)。 因 为 在 遍历 的 过 程 中 ， 每 进行 一 次 递归 调用 ， 都 是 将 函数 的 
“活动 记录 ” 压 入 栈 中 ， 因 此 ， 栈 的 容量 恰 为 树 的 高 度 。 在 最 坏 情况 下 ， 二 又 树 是 有 n 个 节点 
且 深 度 为 n 的 单 枝 树 ， 遍 历 算法 的 空间 复杂 度 也 为 O(n)。 

设 二 又 树 的 根 节 点 所 在 层 数 为 1， 二 又 树 的 层 序 遍 历 就 是 从 树 的 根 节点 出 发 ， 首 先 访问 第 
1 层 的 树 根 节点 ， 然 后 从 左 到 右 依次 访问 第 二 层 上 的 节点 ， 其 次 是 第 三 层 上 的 节点 ， 以 此 类 推 ， 
自 上 而 下 、 自 左 至 右 逐 层 访问 树 中 各 层 节 点 的 过 程 就 是 层 序 遍 历 。 


第 3 章 数据 结构 与 算法 “ 国 137 荐 


6， 最 优 二 又 树 


最 优 二 又 树 又 称 为 哈 夫 曼 树 ， 是 一 类 带 权 路 径 长 度 最 短 的 树 。 

从 树 中 一 个 节点 到 另 一 个 节点 之 间 的 通路 称 为 节点 间 的 路 径 ， 该 通路 上 分 支 数目 称 为 路 径 
长 度 。 树 的 路 径 长 度 是 从 树 根 到 每 一 个 时 子 之 间 的 路 径 长 度 之 和 。 节 点 的 带 权 路 径 长 度 为 从 该 
节点 到 树 根 之 间 的 路 径 长 度 与 该 节点 权 的 乘积 。 

树 的 带 权 路 径 长 度 为 树 中 所 有 叶子 节点 的 带 权 路 径 长 度 之 和 ， 记 为 


WPL= 六 wl 
k=1 


其 中 为 带 权 叶 子 节点 数目 ，wi 为 叶子 节点 的 权 值 ，h 为 叶子 节点 到 根 节点 的 路 径 长 度 。 

最 优 二 又 树 是 指 权 值 为 wi,w2,，…, w 的 n 个 叶子 节点 的 二 又 树 中 带 权 路 径 长 度 最 小 的 二 又 
树 。 例 如 ， 在 图 3-21 中 所 示 的 具有 4 个 叶子 节点 的 二 叉 树 中 ， 以 图 3-21 (b) 所 示 二 又 树 的 带 
权 路 径 长 度 最 小 。 


(a) WPL= (2+4+5+7)x2 =36 (b) WPL=(2+4)x3+5x2+7x1 =35 (¢) WPL=(4+5)x3+7x2+2=43 


图 3-21 不 同 带 权 路 径 长 度 的 二 又 树 


构造 最 优 二 又 树 的 哈 夫 曼 方法 如 下 。 

(1) 根据 给 定 的 个 权 值 {wi, wz，…, w,} 构 成 n 棵 二 叉 树 的 集合 F= {7T, mDP，…, TT,}， 其 
中 每 棵 树 7 中 只 有 一 个 带 权 为 w 的 根 节点 ， 其 左右 子 树 均 空 。 

(2) 在 正中 选取 两 棵 根 节 点 的 权 值 最 小 的 树 作为 左右 子 树 ， 构 造 一 棵 新 的 二 又 树 ， 置 新 构 
造 二 叉 树 的 根 节点 的 权 值 为 其 左 、 右 子 树 根 节点 的 权 值 之 和 。 

(3) 从 瓦 中 删除 这 两 棵 树 ， 同 时 将 新 得 到 的 二 又 树 加 入 到 正中。 
重复 (2)、(3) 步 ， 直 到 书 中 只 含 一 棵 树 时 为 止 ， 这 棵 树 便 是 最 优 二 叉 树 〈 哈 夫 曼 树 )。 

最 优 二 又 树 的 一 个 应 用 是 对 字符 集中 的 字符 进行 编码 和 译 码 。 

对 给 定 的 字符 集 D={qi, d;,…, dg} 及 权 值 集合 了 瑟 fwu w，…, ww}， 构造 其 哈 夫 曼 编码 的 方 
法 为 : 以 四 4;,…, 四 作为 叶子 节点 ，wb w2,，…, wn 作为 对 应 叶子 节点 的 权 值 ， 构 造 出 一 棵 最 
优 二 又 树 ， 然 后 将 树 中 每 个 节点 的 左 分 支 标 上 0， 右 分 支 标 上 1， 则 每 个 叶子 节点 代表 的 字符 
的 编码 就 是 从 根 到 叶子 的 路 径 上 的 0、1 字符 组 成 的 串 。 
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例如 ， 设 有 字符 集 {a,b,c,qd,e} 及 对 应 的 权 值 集合 {0.30,0.25,0.15,0.22,0.08}， 按 照 构造 最 优 二 
叉 树 的 哈 夫 曼 方 法 : 先 取 字符 c 和 e 所 对 应 的 节点 构造 一 棵 二 叉 树 〈 根 节点 的 权 值 为 c 和 e 的 
权 值 之 和 )， 然 后 与 4 对 应 的 节点 分 别 作为 左 、 右 子 树 构造 
二 叉 树 , 之 后 选 a 和 b 所 对 应 的 节点 作为 左 、 右 子 树 构造 二 
叉 树 ， 最 后 得 到 的 最 优 二 又 树 〈 哈 夫 曼 树 ) 如 图 3-22 所 示 。 
其 中 ， 字符 a 的 编码 为 00， 字 符 h»、c、d、e 的 编码 分 别 为 
01、100、11、101。 译 码 时 就 从 树 根 开始 ， 若 编码 序列 中 当 
前 编码 为 0, 则 进入 当前 节点 的 左 子 树 ; 为 1 则 进入 右 子 树 ， 
到 达 叶子 时 一 个 字符 就 翻译 出 来 了 , 然后 再 从 树 根 开 始 重复 
上 述 过 程 ， 直 到 编码 序列 结束 。 例 如 ， 若 编码 序列 
101110000100 对 应 的 字符 编码 采用 图 3-22 所 示 的 树 进行 构 
造 ， 则 可 翻译 出 字符 序列 “edaac”。 图 3-22 哈 夫 曼 树 及 编码 示例 


7， 二 又 查找 树 


二 又 查找 树 又 称 为 二 又 排序 树 ， 它 或 者 是 一 棵 空 树 ， 或 者 是 具有 如 下 性 质 的 二 又 树 。 

(1) 若 它 的 左 子 树 非 空 ， 则 左 子 树 上 所 有 节点 的 关键 码 值 均 小 于 根 节 点 的 关键 码 值 ; 

(2) 若 它 的 右 子 树 非 空 ， 则 右 子 树 上 所 有 节点 的 关键 码 值 均 大 于 根 节点 的 关键 码 值 ; 

(3) 左 、 右 子 树 本 身 就 是 两 棵 二 又 查找 树 。 

一 棵 二 又 查找 树 如 图 3-23 (a) 所 示 。 图 3-23(b) 所 示 的 二 又 树 不 是 二 又 查找 树 ， 
46 比 54 小 ， 它 应 该 在 根 节点 54 的 左 子 树 上 。 

从 二 又 查找 树 的 定义 可 知 ， 对 二 又 查找 树 进行 中 序 遍 历 ， 可 得 到 一 个 关键 码 递增 有 序 的 节 
点 序列 。 
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(b) 非 二 叉 查 找 树 
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(a) 二 又 查找 树 


图 3-23 二 又 查找 树 与 非 二 又 查找 树 
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3.32 图 


图 是 比 树 结构 更 复杂 的 一 种 数据 结构 。 在 树 结构 中 ， 可 认为 除根 节点 没有 前 驱 节 点 外 ， 其 
余 的 每 个 节点 只 有 唯一 的 一 个 前 驱 〈 双 亲 ) 节点 和 多 个 后 继 〈 子 树 ) 节点。 而 在 图 结构 中 ， 任 
意 两 个 节点 之 间 都 可 能 有 直接 的 关系 ， 所 以 图 中 一 个 节点 的 前 驱 和 后 继 的 数目 是 没有 限制 的 。 
图 结构 被 用 于 描述 各 种 复杂 的 数据 对 象 ， 在 自然 科学 、 社 会 科学 和 人 文科 学 等 许多 领域 有 非常 
广泛 的 应 用 。 


1. 图 的 定义 及 术语 


图 G 是 由 两 个 集合 广 和 构成 的 二 元 组 , 记 作 G=(y, 己 ,其 中 依 是 图 中 顶点 的 非 空 有 限 
集合 ，5 是 图 中 边 的 有 限 集合 。 从 数据 结构 的 逻辑 关系 角度 来 看 ， 图 中 任 一 顶点 都 有 可 能 与 图 
中 其 他 项 点 有 关系 ， 而 图 中 所 有 项 点 都 有 可 能 与 某 一 顶点 有 关系 。 在 图 中 ， 数 据 结构 中 的 数据 
元 素 用 项 点 表示 ， 数 据 元 素 之 间 的 关系 用 边 表示 。 
。 有 向 图 : 若 图 中 每 条 边 都 是 有 方向 的 ， 则 称 为 有 向 图 。 从 顶点 到 的 有 向 边 <w > 
也 称 为 弧 ， 起 点 % 称 为 弧 尾 ， 终 点 vw 称 为 弧 头 。 在 有 向 图 中 ，<v vw> 与 <v v> 分 别 表 
示 两 条 弧 ， 如 图 3-24 (a) 所 示 。 
。 无 向 图 :车 图 中 的 每 条 边 都 是 无 方向 的 ， 顶 点 %w 和 vw 之 间 的 边 用 (wv) 表示 。 在 无 向 
图 中 ，Cw vw) 与 (ww) 表示 的 是 同一 条 边 。5 个 顶点 的 一 个 无 向 图 如 图 3-24(b) 所 示 。 
。 完全 图 : 若 一 个 无 向 图 具有 个 顶点 ， 而 每 一 个 顶点 与 其 他 n-1 个 顶点 之 间 都 有 边 ， 
则 称 之 为 无 向 完全 图 。 显然 , 含有 个 顶点 的 无 向 完全 图 共有 n(n-1)/2 条 边 。 类 似 地 ， 
有 nn 个 项 点 的 有 向 完全 图 中 弧 的 数目 为 n(n_1)， 即 任意 两 个 不 同 顶点 之 间 都 存在 方向 


相反 的 两 条 弧 。 
Ga © TS 


(a) 有 向 图 (b) 无 向 图 


图 3-24 有 向 图 和 无 向 图 示意 图 


出 度 和 入 度 : 顶点 v 的 度 是 指 关 联 于 该 顶点 的 边 的 数目 ， 记 作 D(v)。 若 G 为 有 向 
， 顶 点 的 度 表示 该 项 点 的 入 度 和 出 度 之 和 。 顶 点 的 入 度 是 以 该 项 点 为 终点 的 有 向 边 
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的 数目 ， 而 顶点 的 出 度 指 以 该 项 点 为 起 点 的 有 向 边 的 数目 ， 分 别 记 为 ID(D 和 OD(v)。 
例如 ， 图 3-24 (a) 中， 顶点 1, 2, 3, 4 的 入 度 分 别 为 1, 2, 1, 1， 出 度 分 别 为 3, 0, 0, 2。 
3-24 (b) 中 ， 顶 点 1, 2, 3, 4, 5 的 度 分 别 为 3, 2, 4, 3, 2。 
。 ”路 径 : 在 无 向 图 G 中 , 从 顶点 vw 到 顶点 vi 的 路 径 是 指 存在 一 个 顶点 序列 yp, way va,…， 
Vins Vg， 使 得 (vp, va)，(vins Vp)，*…，(vin, vg) 均 属于 E(G)。 若 G 是 有 向 图 ， 其 路 径 也 是 
有 方向 的 ， 它 由 E(G) 中 的 有 向 边 <y, vn>, <vi, vp>,…, <vin, vy 六 组 成 。 路 径 长 度 是 路 径 
上 边 或 弧 的 数目 。 第 一 个 顶点 和 最 后 一 个 顶点 相同 的 路 径 称 为 回路 或 环 。 若 一 条 路 径 
上 除了 和 vi 可 以 相同 外 ， 其 余 顶 点 均 不 相同 ， 这 种 路 径 称 为 一 条 简单 路 径 。 
。 子 图 : 车 有 两 个 图 G=(V,E) 和 G'=(V',E')， 如 果 六 cyV 且 E'cE， 则 称 G' 为 G 的 
子 图 。 
。 连通 图 : 在 无 向 图 G 中 , 若 从 顶点 六 到 顶点 六 有 路 径 , 则 称 项 点 wv 和 顶点 vw 是 连通 的 。 
如 果 无 向 图 G 中 任意 两 个 顶点 都 是 连通 的 ， 则 称 其 为 连通 图 。 图 3-24 (b) 所 示 的 无 
向 图 是 连通 图 。 
。 强 连 通 图 : 在 有 向 图 G 中 ， 如 果 对 于 每 一 对 顶点 ww，vwEV 且 vzw， 从 顶点 vw 到 顶点 
苹 和 从 顶点 到 顶点 vi 都 存在 路 径 ， 则 称 图 G 为 强 连 通 图 。 图 3-24 〈a) 所 示 的 有 向 
图 不 是 强 连通 图 。 以 顶点 1 和 顶点 3 为 例 ， 顶 点 1 至 顶点 3 存在 路 径 ， 而 顶点 3 至 顶 
点 1 没有 路 径 。 
。 网 : 边 (或 弧 ) 具有 权 值 的 图 称 为 网 。 
从 图 的 逻辑 结构 的 定义 来 看 ， 图 中 的 顶点 之 间 不 存在 全 序 关系 〈 即 无 法 将 图 中 的 顶点 排列 
成 一 个 线性 序列 )， 任 何 一 个 顶点 都 可 被 看 成 第 一 个 顶点 ， 另 一 方面 ， 任 一 顶点 的 邻接 点 之 间 
也 不 存在 次 序 关 系 。 为 便于 运算 ， 为 图 中 每 个 顶点 赋予 一 个 序号 。 


2. 图 的 存储 结构 


邻接 矩阵 和 邻接 表 是 两 种 常用 的 图 的 存储 结构 。 

1) 邻接 矩阵 表示 法 

邻接 矩阵 表示 法 利用 一 个 矩阵 来 表示 图 中 顶点 之 间 的 关系 。 对 于 具有 n 个 顶点 的 图 G=(7， 
三 来 说 ， 其 邻接 矩阵 是 一 个 n 阶 方 了 泗 ， 且 满足 : 

A = 1 车 (vi,vj) 或 < Vv; > 是 E 中 的 边 
0 若 (v,vj) 或 <v,v; > 不 是 E 中 的 边 

有 向 图 和 无 向 图 的 邻接 矩阵 如 图 3-25 中 的 矩阵 4 和 B 所 示 。 
由 邻接 矩阵 的 定义 可 知 ， 无 向 图 的 邻接 矩阵 是 对 称 的 ， 而 有 向 图 的 邻接 矩阵 则 不 一 定 具 有 
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(b) 无 向 图 


图 3-25 有 向 图 和 无 向 图 的 邻接 矩阵 存储 示意 图 


借助 于 邻接 矩阵 ， 可 判定 任意 两 个 顶点 之 间 是 否 有 边 〈 或 弧 ) 相连 ， 并 且 容 易 求 得 各 个 顶 
点 的 度 。 对 于 无 向 图 ， 顶 点 w 的 度 是 邻接 矩阵 中 第 守 行 〈 或 列 ) 的 值 不 为 0 的 元 素数 目 〈 或 元 
素 的 和 ); 对 于 有 向 图 ， 第 i 行 的 元 素 之 和 为 项 点 v 的 出 度 OD(v)， 第 j 列 的 元 素 之 和 为 项 点 v 
的 入 度 ID(w)。 
类 似 地 ， 网 〈 赋 权 图 ) 的 邻接 矩阵 可 定义 为 
a 全 车 (wv 或 <vwvj> 是 E 中 的 边 
吕 车 (vv) 或 <vi,vj > 不 是 已 中 的 边 


图 3-26 所 示 的 是 网 及 其 邻接 矩阵 C。 


88w8s 上 8 


8w888 
一 88888 
88aw8338 


3-26 ”一 个 网 及 其 邻接 矩阵 表示 


若 图 用 邻接 矩阵 表示 ， 则 图 的 数据 类 型 可 定义 为 : 
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#define MaxN 36 /# 图 中 顶点 数目 的 最 大 值 %/ 
typedefint AdjMatrix[MaxN][MaxN]; /# 邻 接 矩 阵 4 
或 
typedef double AdjMatrix[MaxN][MaxN]; /# 网 〈 赋 权 图 ) 的 邻接 矩阵 所 
typedef struct { 
int Vnum; /* 图 中 的 顶点 数目 #/ 
AdjMatrix Arcs; 
}Graph; 


2) 邻接 链表 表示 法 
邻接 链表 指 的 是 为 图 的 每 个 顶点 建立 一 个 单 链表 ， 第 i 个 单 链表 中 的 节点 表示 依附 于 顶点 
的 边 (对 于 有 向 图 是 以 vw 为 尾 的 弧 )。 邻 接 链 表 中 的 节点 有 表 节 点 和 表 头 节点 两 种 类 型 ， 如 下 


所 示 。 
表 节 点 表 头 节 点 
| data | firstare | 
其 中 各 参数 的 含义 如 下 。 


。 ”adjvex: 指示 与 顶点 vi 邻接 的 顶点 的 序号 。 

。 nextarc: 指示 下 一 条 边 或 弧 的 节点 。 

。 info: 存储 和 边 或 弧 有 关 的 信息 ， 如 权 值 等 。 

。 data: 存储 顶点 v 的 名 或 其 他 有 关 信 息 。 

。 ”firstarc: 指示 链表 中 的 第 一 个 节点 。 

这 些 表 头 节点 通常 以 顺序 结构 的 形式 存储 ， 以 便 随 机 访问 任 一 顶点 及 其 邻接 表 。 若 图 用 邻 
接 链表 来 表示 ， 则 对 应 的 数据 类 型 可 定义 如 下 : 


#define MaxN 36 让 图 中 顶点 数目 的 最 大 值 */ 
typedef struct ArcNode{ 证 邻接 链表 的 表 节 点 类 型 */ 
int adjvex; * 邻 接 顶 点 的 顶点 序号 */ 
double weight; 族 边 ( 弧 ) 上 的 权 值 */ 
struct ArcNode *nextarc; /# 下 一 个 邻接 顶点 4 
}EdgeNode; 
typedef struct VNode{ 证 邻接 链表 的 头 节点 */ 
char data; 族 顶 点 表示 的 数据 ， 以 一 个 字符 表示 */ 
struct ArcNode *firstarc; /# 指 向 第 一 条 依附 于 该 顶点 的 边 〈 弧 ) 的 指针 #/ 
}AdjList[MaxN]; 


typedef struct { 
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int Vnum; /# 图 中 实际 的 顶点 数目 #/ 
AdjList ”Vertices; 
}Graph; 


显然 , 对 于 有 nn 个 顶点 、e 条 边 的 无 向 图 来 说 , 其 邻接 链表 需要 个 头 节点 和 2e 个 表 节 点 ， 


如 图 3-27 所 示 。 对 于 无 向 图 的 邻接 链表 ， 顶 点 vi 的 度 恰 为 第 i 个 邻接 链表 中 表 节 点 的 数目 。 
j=[4T 人 
[人 | 
=[41 J-[5IA 人 
二 ~L5TA 
3 局 =[L4T 和 
(a) 无 向 图 (b) 无 向 图 的 邻接 表 表 示 


图 3-27 无 向 图 的 邻接 表 表示 


图 3-28 (b) 是 图 3-28 (a) 所 示 有 向 图 的 邻接 表 。 从 中 可 以 看 出 ， 由 于 第 i 个 邻接 链表 中 
表 节 点 的 数目 只 是 顶点 的 出 度 ， 因 此 必须 逐个 扫描 每 个 项 点 的 邻接 表 ， 才 能 求 出 一 个 项 点 的 


入 度 。 为 此 ， 可 以 建立 一 个 有 向 图 的 逆 邻 接 链表 ， 如 图 3-28 〈c) 所 示 。 

@@ ©) oH of dB 
i 1 
2 | 二-GIA 2| | 二 -FOX 
3| 六 | 十 =[L0T 和 ] 3| 六 | 才 =L2 TA 人 

QC) @ 

(a) 有 向 图 (b) 邻接 表 (c) 逆 邻 接 表 
图 3-28 有 向 图 的 邻接 表 及 逆 邻 接 表 表示 


3.4 ”常用 算法 
3.4.1 算法 概述 


1. 算法 的 基本 概念 


算法 是 问题 求解 过 程 的 精确 描述 ， 它 为 解决 某 一 特定 类 型 的 问题 规定 了 一 个 运算 过 程 ， 并 
且 具 有 下 列 特性 。 
(1) 有 穷人 性。 一 个 算法 必须 在 执行 有 穷 步 骤 之 后 结束 ， 且 每 一 步 都 可 在 有 穷 时 间 内 完成 。 
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(2) 确定 性 。 算 法 的 每 一 步 必须 是 确切 定义 的 ， 不 能 有 歧义 。 

(3) 可 行 性 。 算 法 应 该 是 可 行 的， 这 意味 着 算法 中 所 有 要 进行 的 运算 都 能 够 由 相应 的 计算 
装置 所 理解 和 实现 ， 并 可 通过 有 穷 次 运算 完成 。 

(4) 输入 。 一 个 算法 有 零 个 或 多 个 输入 , 它们 是 算法 所 需 的 初始 量 或 被 加 工 的 对 象 的 表示 。 
这 些 输 入 取 自 特定 的 对 象 集合 。 

(5) 输出 。 一 个 算法 有 一 个 或 多 个 输出 ， 它 们 是 与 输入 有 特定 关系 的 量 。 

因此 ， 算 法 实质 上 是 特定 问题 的 可 行 的 求解 方法 、 规 则 和 步骤 。 一 个 算法 的 优 劣 可 从 以 下 
儿 个 方面 考查 。 

(1) 正确 性 。 正 确 性 也 称 为 有 效 性 ， 是 指 算法 能 满足 具体 问题 的 要 求 。 即 对 任何 合法 的 输 
入 ， 算 法 都 能 得 到 正确 的 结果 。 

(2) 可 读 性 。 可 读 性 指 算法 被 理解 的 难 易 程度 。 人 们 常 把 算法 的 可 读 性 放 在 比较 重要 的 位 
置 ， 因 为 星 涩 难 懂 的 算法 不 易 交 流 和 推广 使 用 ， 也 难以 修改 和 扩展 。 因 此 ， 设 计 的 算法 应 尽 可 
能 简单 易 懂 。 

(3) 健壮 性 。 健 壮 性 也 称 为 鲁 棒 性 ， 即 对 非法 输入 的 抵抗 能 力 。 对 于 非法 的 输入 数据 ， 算 
法 应 能 加 以 识别 和 处 理 ， 而 不 会 产生 误 动 作 或 执行 过 程 失 控 。 

(4) 效率 。 粗 略 地 讲 ， 就 是 算法 运行 时 花费 的 时 间 和 使 用 的 空间 。 对 算法 的 理想 要 求 是 运 
行 时 间 短 、 占 用 空间 小 。 


2， 算 法 与 数据 结构 


算法 与 数据 结构 密切 相关 ， 算 法 实现 时 总 是 建立 在 一 定 的 数据 结构 基础 之 上 。 

计算 机 程序 从 根本 上 看 包括 两 方面 的 内 容 : 一 是 对 数据 的 描述 ， 二 是 对 操作 (运算 ) 的 描 
述 。 概 括 来 讲 ， 在 程序 中 需要 指定 数据 的 类 型 和 数据 的 组 织 形式 就 是 定义 数据 结构 ， 描 述 的 操 
作 步 又 就 构成 了 算法 。 因 此 ， 从 某 种 意义 上 可 以 说 “数据 结构 + 算法 = 程序 ”。 

当然 ， 设 计 程 序 时 还 需 选 择 不 同 的 程序 设计 方法 、 程 序 语言 及 工具 。 但 是 ， 数 据 结 构 和 算 
法 仍然 是 程序 中 最 为 核心 的 内 容 。 用 计算 机 求解 问题 时 ， 一 般 应 先 设计 初步 的 数据 结构 ， 然 后 
再 考虑 相关 的 算法 及 其 实现 。 设 计数 据 结构 时 应 当 考 虑 可 扩展 性 ， 修 改 数据 结构 会 影响 算法 的 
实现 方案 。 


3. 算法 的 描述 


算法 的 描述 方法 有 很 多 ， 若 用 程序 语言 描述 ， 就 成 了 计算 机 程序 。 常 用 的 算法 描述 方法 有 
流程 图 、NS 盒 图 、 伪 代码 和 决策 表 等 。 
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(1) 流程 图 。 流 程 图 (Flow Chart) 即 程序 框图 ， 是 历史 最 久 、 流 行 最 广 的 一 种 算法 的 图 
形 表示 方法 。 每 个 算法 都 可 由 若干 张 流程 图 描述 。 流 程 图 给 出 了 算法 中 所 进行 的 操作 以 及 这 些 
操作 执行 的 逻辑 顺序 。 程 序 流程 图 包括 三 种 基本 成 分 : 加 工 步骤 ， 用 方 框 表示 ; 逻辑 条 件 ， 用 
葵 形 表示 ;控制 流 ， 用 箭头 表示 。 流 程 图 中 常用 的 几 种 符号 如 图 3-29 所 示 。 

) / 
起 / 止 点 输入 /输出 处 理 村 预定 义 处 理 
一 OO CO 二 
判断 控制 流 外 接 内 接 


图 3-29 流程 图 的 基本 符号 


例如 ， 求 正 整数 m 入 n 的 最 大 公约 数 流程 图 如 图 3-30(a〉 所 示 。 若 流程 图 中 的 循环 结构 
通过 控制 变量 以 确定 的 步 长 进行 计 次 循环 ， 则 可 用 器 和 已 分别 表示 “循环 开始 ”和 “循环 结 
束 ”， 并 在 “循环 开始 ” 框 中 标注 “循环 控制 变量 ,初始 值 ， 终 止 值 ， 增 量 ”， 如 图 3-30 (b) 
所 示 。 


输入 正 整 数 m 和 n 


ro-mMoDn 


(a) 求 m 和 n 的 最 大 公约 数 (b) 求 112+…+10 


图 3-30 算法 的 流程 图 表示 
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(2) N/S 盒 图 。 盒 图 是 结构 化 程序 设计 出 现 之 后 ， 为 支持 这 种 设计 方法 而 产生 的 一 种 描述 


[ 具 。N/S 盒 图 的 基本 元 素 与 控制 结构 如 图 3-31 所 示 。 在 NS 图 中 ， 每 个 处 理 步骤 用 一 个 盒子 
表示 ， 盒 子 可 以 嵌 套 。 对 于 每 个 盒子 ， 只 能 从 上 面 进入 ， 从 下 面 走出 ， 除 此 之 外 别 无 其 他 出 入 

， 所 以 盒 图 限制 了 随意 的 控制 转移 ， 保 证 了 程序 的 良好 结构 。 

处 理 A 条 件 case 条 件 

处 理 B 成 立 不 成 立 值 1 | 值 2 值 n 

处 理 C 处 理 A 处 理 B 处 理 1 | 处 理 2 处 理 n 
(a) 顺序 结构 (b) 选择 结构 (c) 多 选择 结构 

循环 条 件 


循环 体 


循环 体 循环 条 件 S 


(d) while-do 循环 结构 


(e) repeat-until 循环 结构 (1) 调用 结构 


图 3-31 N/S 盒 图 的 基本 元 素 与 控制 结构 
用 N/S 盒 图 描述 求 最 大 公约 数 的 欧 几 里 得 算法 ， 如 图 3-32 所 示 


输入 正 整 数 m 入 n 


r— mMoODn 


7r<> 0? 


| bl 3 ss 


r—-mMoDn 


输出 公约 数 n 


3-32 求 m、n 的 最 大 公约 数 的 N/S 盒 图 


(3) 伪 代 码 。 用 伪 代 码 描述 算法 的 特点 是 借助 于 程序 语言 的 语法 结构 和 自然 语言 叙述 ， 使 
算法 具有 良好 的 结构 又 不 拘泥 于 程序 语言 的 限制 。 这 样 的 算法 易 读 易 写 , 而 且 容 易 转换 成 程序 。 
(4) 决策 表 。 决 策 表 是 一 种 图 形 工具 ， 它 将 比较 复杂 的 决策 问题 简洁 、 明 确 、 一 目 了 然 地 


描述 4 
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H 来 。 例 如， 如 果 订 购 金额 超过 500 元 ， 以 前 没有 欠 账 ， 则 发 出 批准 单 和 提货 单 ， 如 果 订 


购 金 额 超过 500 元 , 但 以 前 的 欠 账 尚未 还 清 ， 则 发 不 予 批准 的 通知 ; 如 果 订 购 金额 低 于 500 元， 
则 不 论 以 前 的 欠 账 是 否 还 清 都 发 批准 单 和 提货 单 ， 在 欠 账 未 还 清 的 情况 下 还 要 发 出 “ 催 款 单 ”。 


处 理 该 问题 的 决策 表 如 表 3-1 所 示 。 
表 3-1 决策 表 

订购 金额 <500 
从 账 情况 未 还 清 
发 不 批准 通知 

发 出 批准 单 y 
发 出 提货 单 y 
发 出 催 款 单 y 

4. 算法 效率 


法 的 执行 
本 操作 )， 


因 


解决 同一 个 问题 总 是 存在 多 种 算法 ， 每 个 算法 在 计算 机 上 执行 时 ， 都 要 消耗 时 间 (CPU 执 
行 指令 的 时 间 ) 和 使 用 存储 空间 资源 。 因 此 ， 设 计算 法 时 需要 考虑 算法 运行 时 所 花费 的 时 间 和 
使 用 的 空间 ， 以 时 间 复 杂 度 和 空间 复杂 度 表 示 。 

由 于 算法 往往 和 需要 求解 的 问题 规模 相关 ， 因 此 常 将 问题 规模 n 作为 一 个 参照 量 ， 求 算法 
的 时 间 、 空 间 开 销 与 的 关系 。 详 细 分 析 指 令 的 执行 时 间 会 涉及 计算 机 运行 过 程 的 细节 ， 因 此 
时 间 消 耗 情况 难以 精确 表示 ， 所 以 算法 分 析 时 常 采用 算法 的 时 空 开销 随 n 的 增长 趋势 来 表示 其 
时 空 复杂 度 。 
对 于 一 个 算法 的 时 间 开 销 7T(n)， 从 数量 级 大 小 考虑 ， 当 n 增 大 到 一 定 值 后 ，7(n) 计 算 公 式 
中 影响 最 大 的 就 是 n 的 究 次 最 高 的 项 , 其 他 的 常数 项 和 低 究 次 项 都 可 以 忽略 , 即 采用 渐进 分 析 ， 
表示 为 T(n)=O(Kn))。 其 中 , n 反映 问题 的 规模 ，7T(n) 是 算法 运行 所 消耗 时 间或 存储 空间 的 总 量 ， 
O 是 数学 分 析 中 常用 的 符号 “大 0” 而 ftn) 是 自 变量 为 n 的 某 个 具体 的 函数 表达 式 。 例 如 ， 若 
f=n+2nt+1， 则 Ttn)=O(n’)。 


下 面 以 语句 频 度 为 基础 给 出 算法 时 间 复杂 度 的 度量 。 


为 它 人 


频 度 〔Frequency Count) 是 指 语句 被 重复 执行 的 次 数 ， 即 对 于 某 个 基本 语句 ， 若 在 算 
过 程 中 被 执行 n 次 , 则 其 语句 频 度 为 n。 这 里 的 “语句 ”是 指 描述 算法 的 基本 语句 ( 基 


它 的 执行 是 不 可 分 割 的 ， 
还 包括 循环 体 或 函数 体 。 


因此 ， 循 环 语句 的 整体 、 函 数 调用 语句 不 能 算 作 基本 语句 ， 


算法 中 各 基本 语句 的 语句 频 度 之 和 表示 算法 的 执行 时 间 。 


例 妇 


， 对 于 下 面 的 三 个 程序 段 (1)、(2)、(3)， 其 实现 基本 操作 “x 增 1” 的 语句 ++x 的 
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语句 频 度 分 别 为 1、m、 王 。 

(1) {s=0; ++x;} 

(2) fori=1;i<=n;itt) {s+=x;+Hx;} 

(3) for(k= 1;k<=n;++k) 

for(i= 1;i<=n; i++) 
{s+= Xx; ++x;} 

因此 ,程序 段 (1)、(2)、(3) 的 时 间 复 杂 度 分 别 为 O(1)、O(n)、O(m”)， 分 别称 为 常量 阶 、 
线性 阶 和 平方 阶 。 若 程序 段 (1)、(2)、(3) 组 成 一 个 算法 的 整体 ， 则 该 算法 的 时 间 复 杂 度 
为 O(n”)。 
3.4.2 排序 


假设 含 个 记录 的 文件 内 容 为 {Ri, Rs，…, R,}， 其 相应 的 关键 字 为 {h, 如 …, 司 }。 经 过 排 
序 确定 一 种 排列 {Ri, Ra，…, R}， 使 得 它们 的 关键 字 满 足 如 下 递增 (或 递减 关系 : <hz<… 
Kb 或 向 > hn). 

1) 排序 的 稳定 性 

车 在 待 排序 的 一 组 序列 中 ，R; 和 及 的 关键 字 相 同 ， 即 = 如， 且 在 排序 前 及 ,领先 于 及 ， 那 
么 当 排序 后 ， 如 果 Ri 和 及 的 相对 次 序 保持 不 变 ，R 仍 领先 于 尺 ， 则 称 此 类 排序 方法 为 稳定 的 。 
若 在 排序 后 的 序列 中 有 可 能 出 现 领先 于 R; 的 情形 ， 则 称 此 类 排序 为 不 稳定 的 。 

2) 内 部 排序 和 外 部 排序 

内 部 排序 是 指 待 排序 记录 全 部 存放 在 内 存 中 进行 排序 的 过 程 。 

外 部 排序 是 指 待 排序 记录 的 数量 很 大 ， 以 至 内 存 不 能 容纳 全 部 记录 ， 在 排序 过 程 中 尚 需 对 
外 存 进行 访问 的 排序 过 程 。 

在 排序 过 程 中 需 进行 下 列 两 种 基本 操作 。 

(1) 比较 两 个 关键 字 的 大 小 。 

(2) 将 记录 从 一 个 位 置 移动 到 另 一 个 位 置 。 


1. 简单 排序 


这 里 的 简单 排序 包括 直接 插入 排序 、 冒 泡 排 序 和 简单 选择 排序 。 

1) 直接 插入 排序 

直接 插入 排序 是 一 种 简单 的 排序 方法 ， 具 体 做 法 是 : 在 插入 第 i 个 记录 时 ，Ri, Rs,…, Ri 
已 经 排 好 序 ， 这 时 将 记录 玉 的 关键 字 上 万 依次 与 关键 字 矿石 2， …, 太 进行 比较 ， 从 而 找到 玉 应 
该 插入 的 位 置 ， 插 入 位 置 及 其 后 的 记录 依次 向 后 移动 。 

【算法 】 直 接 插入 排序 算法 。 
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void Insertsort(int data[], intn ) 
人 # 将 数组 data[0] 一 data[n-1] 中 的 半 个 整数 按 非 递减 有 序 的 方式 进行 排列 拟 
{ inti,j; 
int tmp; 
for(i= 1;i<mn; i++){ 
这 (data[i] < data[i-1]) { 
tmp = dataf[i]; data[i] = data[i-1]; 
for( = i-1; j>=0&&data[j] > tmp; j--) data[j+1] = data[j]; 
data[j+1] = tmp; 
/if 
}/*for*/ 
}/*Insertsort*/ 


直接 插入 排序 法 在 最 好 情况 下 〈 待 排序 列 已 按 关 键 码 有 序 )， 每 趟 排序 只 需 作 1 次 比较 且 
不 需要 移动 元 素 ， 因 此 n 个 元 素 排 序 时 的 总 比较 次 数 为 n-1 次 ， 总 移动 次 数 为 0 次。 在 最 坏 情 
况 下 元素 已 经 逆序 排列 )， 进 行 第 i 越 排序 时 ， 待 插入 的 记录 和 需要 同 前 面 的 i 个 记录 都 进行 1 


次 比较 , 因此， 总 比较 次 数 为 $=. 排序 过 程 中 , 第 i 趟 排序 时 移动 记录 的 次 数 为 寺 1 


(包括 移 进 、 移 出 tmp)， 总 移动 次 数 为 久 (+D = 


i=2 

由 此 ， 直 接 插入 排序 是 一 种 稳定 的 排序 方法 ， 其 时 间 复 杂 度 为 O(n”)。 排 序 过 程 中 仅 需 要 
一 个 元 素 的 辅助 空间 ， 空 间 复 杂 度 为 0(1)。 

2) 冒 泡 排 序 

n 个 记录 进行 冒 泡 排 序 的 方法 是 ， 首先 将 第 一 个 记录 的 关键 字 和 第 二 个 记录 的 关键 字 进行 
比较 ， 若 为 道 序 ， 则 交换 两 个 记录 的 值 ， 然 后 比较 第 二 个 记录 和 第 三 个 记录 的 关键 字 ， 以 此 类 
推 ， 直 至 第 n-1 个 记录 和 第 n 个 记录 的 关键 字 比 较 完 为 止 。 上 述 过 程 称 作 一 越 冒 泡 排序 ， 其 结 
果 是 关键 字 最 大 的 记录 被 交换 到 第 二 个 位 置 。 然 后 进行 第 二 趟 冒 泡 排序 ， 对 前 n-1 个 记录 进行 
同样 的 操作 ， 其 结果 是 关键 字 次 大 的 记录 被 交换 到 第 二 1 个 位 置 。 当 进行 完 第 n-1 趟 时 ， 所 有 
记录 有 序 排列 。 

【算法 】 冒 泡 排序 算法 。 


(n+3)(n—2) 
eT. 


void Bubblesort(int data[],intn ) 
/# 将 数组 data[0] 一 data[n-1] 中 的 n 个 整数 按 非 递减 有 序 的 方式 进行 排列 */ 
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{ int ij,tag; ”人 * 用 tag 表示 排序 过 程 中 是 否 交 换 过 元 素 值 */ 
int tmp; 
for(i= ltag= l;tag — 1&&i< mitt){ 
tag= 0; 
for( = 0;j <n-i:jt+) 
if (data[j]>data[j+1]){ 
tmp = data[j]; data[j] = data[j+1]; data[j+1] = tmp; 
tag= 1; 
MM/*if*/ 
}/*for*/ 
MW/*Bubblesort*/ 


冒 泡 排序 法 在 最 好 情况 下 〈 待 排序 列 已 按 关键 码 有 序 ) 只 需 作 1 趟 排序 ， 元 素 的 比较 次 数 
为 n-1 且 不 需要 交换 元 素 ， 因 此 总 比较 次 数 为 n-1 次 ， 总 交换 次 数 为 0 次 。 在 最 坏 情况 下 元 
素 已 经 逆序 排列 )， 进 行 第 i 趟 排序 时 ， 最 大 的 i-1 个 元 素 已 经 排 好 序 ， 其 余 的 n-(i-1) 个 元 素 需 


nl 
要 进行 mi 次 比较 和 ni 次 交换 ， 因 此 总 比较 次 数 为 也 (n- 站 = 全 ， 冲 交换 次 数 为 
i=1 


Hi 一 
20 = 2 1) . 


由 此 ， 冒 泡 排序 是 一 种 稳定 的 排序 方法 ， 其 时 间 复 杂 度 为 O02)。 排 序 过 程 中 仅 需要 一 个 元 
素 的 辅助 空间 用 于 元 素 的 交换 ， 空 间 复杂 度 为 0(1)。 
3) 简单 选择 排序 
于 个 记录 进行 简单 选择 排序 的 基本 方法 是 : 通过 ni 次 关键 字 之 间 的 比较 ， 从 nitl 个 记 
录 中 选 出 关键 字 最 小 的 记录 , 并 和 第 i(1<i<n) 个 记录 进行 交换 , 当 i 等 于 n 时 所 有 记录 有 序 排列 。 
【算法 】 简 单 选择 排序 算法 。 
void Selectsort(int data[],intn ) 
/# 将 数组 data[0] 一 data[n-1] 中 的 壮 个 整数 按 非 递减 有 序 的 方式 进行 排列 拟 
{ intijk; 
inttmp; 
for(i= 1;1< mii++H){ 
k=i; 
forG =itlij <=n:j++) 证 找 出 最 小 元 素 的 下 标 ， 用 表示 */ 
if (data[j] < data[k) k=j; 
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if(k!=i){ 


tmp = data[i]; data[i] = data[k]; data[k] = tmp; 


Jsifw 
}/*for*/ 


}/*Selects' 


Ort*/ 


简单 选择 排序 法 在 最 好 情况 下 〈 待 排序 列 已 按 关键 码 有 序 〉 不 需要 移动 元 素 ， 因 此 n 个 元 
素 排序 时 的 总 移动 次 数 为 0 次 。 在 最 坏 情况 下 〈 元 素 已 经 逆序 排列 )， 每 趟 排序 移动 记录 的 次 


数 都 为 3 次 ( 


7 一 1 
况 下 ， 元 素 的 总 比较 次 数 为 了 ,mn-D= 20 ， 


两 个 数组 元 素 交 换 值 )， 共 进行 n-1 趟 排序 ， 总 移动 次 数 为 3(n-1)。 无 论 在 哪 种 情 


i=1 


由 此 ， 简 单 选择 排序 是 一 种 不 稳定 的 排序 方法 ， 其 时 间 复 杂 度 为 O(n”)。 排 序 过 程 中 仅 需 要 
一 个 元 素 的 辅助 空间 用 于 数组 元 素 值 的 交换 ， 空 间 复杂 度 为 0(1)。 


2.， 希 尔 


排序 


希 尔 排序 又 称 “ 缩 小 增 量 排序 ”， 是 对 直接 插入 排序 方法 的 改进 。 
希 尔 排序 的 基本 思想 是 : 先 将 整个 待 排 记录 序列 分 割 成 若干 子 序列 ， 然 后 分 别 进行 直接 插 


入 排序 , 待 整 


个 序列 中 的 记录 基本 有 序 时 ,再 对 全 体 记录 进行 一 次 直接 插入 排序 。 具 体 做 法 是 : 


先 取 定 一 个 小 于 n 的 整数 d 作为 第 一 个 增 量 ， 把 文件 的 全 部 记录 分 成 d1 组 ， 将 所 有 距离 为 dl 


倍数 的 记录 放 在 同一 个 组 中 ， 在 各 组 内 进行 直接 插入 排序 ， 然 后 取 第 二 个 增 量 d, (ds<4d1)， 重 


复 上 述 的 分 组 


L 和 直接 插入 排序 过 程 ， 以 此 类 推 ， 直 至 所 取 的 增 量 d=1(di<4;1<…<4<41)， 即 所 


有 记录 放 在 同 


一 组 进行 直接 插入 排序 为 止 。 


增 量 序列 为 5，3，1 时 ， 希 尔 插入 排序 过 程 如 图 3-33 所 示 。 


[初始 关键 字 ]: 48 37 64 96 75 12 26 48 54 03 


48 12 
37 26 
64 48 
96 54 
75 03 
第 一 趟 排序 结果 : ” 12 26 各 54 03 48 37 64 9% 75 
12 54 37 75 
26 03 64 
48 48 96 


第 二 趟 排序 结果 : 12 03 48 37 26 48 54 64 96 75 
第 三 趟 排序 结果 : 03 12 26 37 48 48 54 64 75 96 


图 3-33 希 尔 排序 示例 
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后 半 


【函数 】 用 希 尔 排序 方法 对 整 型 数组 进行 非 递 减 排序 。 


void shellsort(int data[],int n) 
{ int *deltak,ibdkj; /构造 一 个 增 量 序列 存 入 delta 
k=n; 
/# 从 k=n 开始 ， 重 复 k=k/2 运算 ， 直 到 k=0， 所 得 k 值 的 序列 作为 增 量 序列 存 入 delta*/ 
delta = (int *)malloc(sizeof(int)*(n/2)); 
i= 0; 
dof 
k=k/2; delta[i++] = k; 
}while(k>0); 
i=0; 
while ((dk = delta[i])) >0) { 
for(k = delta[i];k < n;++k) 
这 (data[k] < data[k-dk]) { /* 将 元 素 data[k] 插 入 到 有 序 增 量 子 表 中 */ 
t= data[k]; 人 备份 待 插入 的 元 素 ， 空 出 一 个 元 素 位 置 所 
for(j = k-dk;j >= 0 && t < data[j]j -= dk) 
data[j+dk] = data[j]; “/* 寻 找 插入 位 置 的 同时 元 素 后 移 */ 
data[j+dk] =t; * 找 到 插入 位 置 ， 插 入 元 素 */ 
/ifw/ 
++i 人 # 取 下 一 个 增 量 值 和 / 
}/*while*/ 
}/* shellsort */ 


希 尔 排序 是 不 稳定 的 排序 方法 。 
3， 快速 排序 


快速 排序 的 基本 思想 是 : 通过 一 趟 排序 将 待 排 的 记录 划分 为 独立 的 两 部 分 ， 称 为 前 半 区 和 


记录 继续 进行 快速 排序 ， 从 而 使 整个 序列 有 序 。 


区 ， 其 中 ， 前 半 区 中 记录 的 关键 字 均 不 大 于 后 半 区 记录 的 关键 字 ， 然 后 再 分 别 对 这 两 部 分 


一 趟 快速 排序 的 过 程 称 为 一 次 划分 ， 具 体 做 法 是 : 附设 两 个 位 置 指示 变量 i 和 jj, 它 作 


] 的 初 


值 分 别 指向 序列 的 第 一 个 记录 和 最 后 一 个 记录 。 设 枢 轴 记录 (通常 是 第 一 个 记录 ) 的 关键 字 为 


pivot, 则 首先 从 j 所 指 位 置 起 向 前 搜索 , 找到 第 一 个 关键 字 小 于 pivot 的 


到 i 指示 的 位 置 ,然后 从 i 所 指 位 置 起 向 后 搜索 ， 找 到 第 一 个 关键 字 大 于 


记录 时 将 该 记录 向 前 移 


录 向 后 移 到 j 所 指 位 置 ， 重 复 该 过 程 直 至 i 与 j 相等 为 止 。 


F pivot 的 记录 时 将 该 记 
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【函数 】 快 速 排序 过 程 中 的 划分 。 


int partition(int data[], int low int high) 
作用 data[low] 作 为 枢 轴 元 素 pivot 进行 划分 */ 
/# 使 得 data[low.i-1] 均 不 大 于 pivot，datali+1..high] 均 不 小 于 pivot*/ 


{ inti,j; intpivot; 
pivot = data[llow]; i=low; j= high; 
while(i <j) { 上 * 从 数组 的 两 端 交替 地 向 中 间 扫 描 */ 
while(i <j && data[j] >= pivot) j--; 
data[i] = datafj]; * 比 枢 轴 元 素 小 者 往 前 移 */ 
while (i <]j && data[i] <= pivot) i++; 
data[j] = data[i]; 卡 比 枢 轴 元 素 大 者 向 后 移 */ 
} 
data[i] = pivot; 
return i; 
} 


【函数 】 用 快速 排序 方法 对 整 型 数组 进行 非 递减 排序 。 


void quickSort(int data[], int low, int high) 
人 # 用 快速 排序 方法 对 数组 元 素 data[low.high] 作 非 递减 排序 #/ 


{ 
if (low<high) { 
int loc = partition(data, low, high); 让 进 行 划分 */ 


quicksort(data,low,loc-1); A* 对 前 半 区 进行 快速 排序 */ 
quicksort(data,loc+ 1,high); /# 对 后 半 区 进行 快速 排序 4 
} 
}/* quickSort */ 


快速 排序 算法 的 时 间 复 杂 度 为 O(nlogzn), 在 所 有 算法 复杂 度 为 此 数量 级 的 排序 方法 中 , 快 
速 排 序 被 认为 是 平均 性 能 最 好 的 一 种 。 但 是 ， 若 初始 记录 序列 按 关 键 字 有 序 或 基本 有 序 时 ， 即 
每 次 划分 都 是 将 序列 划分 为 某 一 半 序 列 的 长 度 为 0 的 情况 ， 此 时 快速 排序 的 性 能 退化 为 时 间 复 
杂 度 是 O(n”)。 快 速 排 序 是 不 稳定 的 排序 方法 。 


4. 堆 排 序 


对 于 n 个 元 素 的 关键 字 序 列 {, 所 …, 后 }， 当 且 仅 当 满 足下 列 关 系 时 称 其 为 堆 。 
| < koi 或 he > ko; 


.< 
< kin 
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车 将 此 序列 对 应 的 一 维 数组 ( 即 以 一 维 数组 作为 序列 的 存储 结构 ) 看 成 是 一 个 完全 二 又 树 ， 
则 堆 的 含义 表明 ， 完 全 二 又 树 中 所 有 非 终 端 节点 的 值 均 不 大 于 或 不 小 于 ) 其 左 、 右 孩子 节点 
的 值 。 因 此 ， 在 一 个 堆 中 ， 堆 顶 元 素 〈 即 完全 二 又 树 的 根 节点 ) 必 为 序列 中 的 最 小 元 素 〈 或 最 


大 元 素 )， 并 且 堆 中 任 一 棵 子 树 也 都 是 堆 。 若 堆 顶 为 最 小 元 素 ， 则 称 为 小 项 堆 ， 若 堆 顶 为 最 大 
元 素 ， 则 称 为 大 项 堆 。 

例如 ， 将 序列 (48，37，64，96，75，12，26，54，03，33) 中 的 元 素 依次 放 入 一 棵 完全 
二 叉 树 中 ， 如 图 3-34 〈a) 所 示 。 显 然 ， 它 既 不 是 大 项 堆 〈48<64)， 也 不 是 小 项 堆 〈48>37)， 
调整 为 大 项 堆 后 如 图 3-34 (b) 所 示 。 


G4 DD Q9 
GD © © 


(a) 非 堆 (b) 大 项 堆 
图 3-34 用 完全 二 又 树 表示 堆 

堆 排序 的 基本 思想 是 : 对 一 组 待 排序 记录 的 关键 字 ， 首 先 把 它们 按 堆 的 定义 排 成 一 个 序列 
〈 即 建立 初始 堆 )， 从 而 输出 堆 顶 的 最 小 关键 字 《〈 对 于 小 项 堆 而 言 )。 然 后 将 剩余 的 关键 字 再 调 
整 成 新 堆 ， 便 得 到 次 小 的 关键 字 ， 如 此 反复 ， 直 到 全 部 关键 字 排 成 有 序 序列 为 止 。 

nn 个 元 素 进行 堆 排 序 时 ， 时 间 复杂 度 为 O(nlog2n)， 空 间 复杂 度 为 0(1)。 堆 排序 是 不 稳定 的 
排序 方法 。 

5. 归并 排序 


所 谓 “归并” 是 将 两 个 或 两 个 以 上 的 有 序 文件 合并 成 为 一 个 新 的 有 序 文件 。 从 线性 表 的 
讨论 可 知 ， 将 两 个 有 序 表 合 并 成 为 一 个 有 序 表 ， 无 论 是 顺序 存储 结构 还 是 链 式 存储 结构 ， 都 是 
容易 实现 的 。 利 用 归并 的 思想 可 以 进行 排序 。 归 并 排序 是 把 一 个 有 n 个 记录 的 无 序 文件 看 成 是 


个 长 度 为 1 的 有 序 子 文件 组 成 的 文件 ， 然 后 进行 两 两 归并 ， 得 到 | 引 个 长 度 为 2 或 1 的 有 
序 文件 ， 再 两 两 归并 ， 如 此 重复 ， 直 至 最 后 形成 包含 ”个 记录 的 有 序 文件 为 止 。 这 种 反复 将 两 
个 有 序 文件 归并 成 一 个 有 序 文件 的 排序 方法 称 为 两 路 归并 排序 。 

5 个 元 素 进行 二 路 归并 排序 的 时 间 复杂 度 为 O(nlogsn)， 空 间 复 杂 度 为 O0D。 二 路 归并 排序 
是 稳定 的 排序 方法 。 
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6， 内 部 排序 方法 小 结 
综合 比较 以 上 所 讨论 的 各 种 排序 方法 ， 大 致 结果 如 表 3-2 所 示 。 
表 3-2 各 种 排序 方法 的 性 能 比较 


排序 方法 | 最 好 时 间 | 平均 时 间 | 最 坏 时 间 | 辅助 空间 [稳定 性 


直接 插入 排序 O(n) O(n’) O(1) 稳定 
简单 选择 排序 O(n’) O(n’) 0O(1) 不 稳定 
冒 泡 排序 O(n) O(n’) OU 稳定 
希 尔 排序 一 OU) 不 稳定 
快速 排序 O(nlogan) O(logzn) 一 O(n) | 不 稳定 
堆 排 序 O(nlog2n) OO) 不 稳定 
归并 排序 O(nlog2n) O(n) 稳定 


不 同 的 排序 方法 各 有 优 缺点 ， 可 根据 需要 运用 到 不 同 的 场合 。 选取 排序 方法 时 需要 考虑 的 
主要 因素 有 : 待 排序 的 记录 个 数 n; 记录 本 身 的 大 小 ;关键 字 的 分 布 情况 ， 对 排序 稳定 性 的 要 
求 ; 语言 工具 的 条 件 ， 辅 助 空间 的 大 小 等 。 
依据 这 些 因素 ， 可 以 得 到 以 下 几 点 结论 。 
(1) 车 待 排序 的 记录 数目 n 较 小 时 ， 可 采用 插入 排序 和 简单 选择 排序 。 由 于 直接 插入 排序 
所 需 的 记录 移动 操作 较 简单 选择 排序 多 ， 因 此 当 记 录 本 身 信息 量 较 大 时 ， 用 简单 选择 排序 方法 
较 好 。 
(2) 车 待 排 序 记录 按 关键 字 基本 有 序 ， 则 宜 采 用 直接 插入 排序 或 冒 泡 排 序 。 
(3) 车 n 较 大 ， 则 应 采用 时 间 复 杂 度 为 O(nlogzn) 的 排序 方法 ， 例 如 快速 排序 、 堆 排序 或 归 
并 排序 。 
快速 排序 是 目前 内 部 排序 方法 中 被 认为 是 最 好 的 方法 ， 当 待 排序 的 关键 字 随机 分 布 时 ， 快 
速 排序 的 平均 时 间 最 短 ， 堆 排序 只 需 一 个 辅助 存储 空间 ， 并 且 不 会 出 现在 快速 排序 中 可 能 出 现 
的 最 坏 情况 。 这 两 种 排序 方法 都 是 不 稳定 的 排序 方法 ， 若 要 求 排 序 稳定 ， 可 选择 归并 排序 。 通 
常 可 将 归并 排序 和 直接 插入 排序 结合 起 来 使 用 。 先 利用 直接 插入 排序 求 得 较 长 的 有 序 子 文件 ， 
然后 再 两 两 归并 。 
前 面 讨论 的 内 部 排序 算法 都 是 在 一 维 数组 上 实现 的 。 当 记录 本 身 信息 量 较 大 时 ， 为 避免 耗 
费 大 量 的 时 间 移 动 记录 ， 可 以 采用 链表 作为 存储 结构 。 


7. 外 部 排序 
外 部 排序 就 是 对 大 型 文件 的 排序 ， 待 排序 的 记录 存放 在 外 存 。 在 排序 的 过 程 中 ， 内 存 只 存 
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储 文件 的 一 部 分 记录 ， 整 个 排序 过 程 需要 进行 多 次 内 外 存 间 的 数据 交换 。 

常用 的 外 部 排序 方法 是 归并 排序 ， 一 般 分 为 两 个 阶段 : 在 第 一 阶段 ， 把 文件 中 的 记录 分 段 
读 入 内 存 ， 利 用 某 种 内 部 排序 方法 对 这 段 记录 进行 排序 并 输出 到 外 存 的 另 一 个 文件 中 ， 在 新 文 
件 中 形成 许多 有 序 的 记录 段 ， 称 为 归并 段 ; 在 第 二 阶段 ， 对 第 一 阶段 形成 的 归并 段 用 某 种 归并 
方法 进行 一 趟 趟 的 归并 , 使 文件 的 有 序 段 逐渐 加 长 , 直到 将 整个 文件 归并 为 一 个 有 序 段 时 为 止 。 


3.4.3 查找 


查找 是 非 数值 数据 处 理 中 一 种 常用 的 基本 运算 , 查找 运算 的 效率 与 查找 表 所 采用 的 数据 结 
构 和 查找 方法 密切 相关 。 


1. 查找 表 及 查找 效率 


查找 表 是 指 由 同一 类 型 的 数据 元 素 〈 或 记录 ) 构成 的 集合 。 由 于 “集合 ”这 种 数据 结构 中 


的 数据 元 素 之 间 存在 着 完全 松散 的 关系 ， 因 此 ， 查 找 表 是 一 种 非常 灵活 的 数据 结构 ， 分 为 静态 
查找 表 和 动态 查找 表 ， 哈 希 表 是 一 种 动态 查找 表 。 

(1) 静态 查找 表 。 对 查找 表 经 常 要 进行 的 两 种 操作 如 下 。 

Q@ 查询 某 个 “特定 ”的 数据 元 素 是 否 在 查找 表 中 。 

@ 检索 某 个 “特定 ”的 数据 元 素 的 各 种 属性 。 

通常 将 只 进行 这 两 种 操作 的 查找 表 称 为 静态 查找 表 。 

(2) 动态 查找 表 。 对 查找 表 经 常 要 进行 的 另外 两 种 操作 如 下 。 

Q@ 在 查找 表 中 插入 一 个 数据 元 素 。 

@ 从 查找 表 中 删除 一 个 数据 元 素 。 

若 在 查找 过 程 中 还 可 能 插入 查找 表 中 不 存在 的 数据 元 素 , 或 者 从 查找 表 中 删除 已 存在 的 某 
个 数据 元 素 ， 则 称 相应 的 查找 表 为 动态 查找 表 。 


( 
元 素 


3) 关键 字 。 它 是 数据 元 素 〈 或 记录 ) 的 某 个 数据 项 的 值 ， 用 它 来 识别 (标识 ) 这 个 数据 
(或 记录 )。 主 关键 字 是 指 能 唯一 标识 一 个 数据 元 素 的 关键 字 ， 次 关键 字 是 指 能 标识 多 个 


数据 元 素 的 关键 字 。 


( 


4) 查找 。 根 据 给 定 的 某 个 值 ， 在 查找 表 中 确定 是 否 存在 一 个 其 关键 字 等 于 给 定 值 的 记录 


或 数据 元 素 。 若 表 中 存在 这 样 的 一 个 记录 ， 则 称 查找 成 功 ， 此 时 或 者 给 出 整个 记录 的 信息 ， 或 


者 指 


记录 在 查找 表 中 的 位 置 ， 若 表 中 不 存在 关键 字 等 于 给 定 值 的 记录 ， 则 称 查找 不 成 功 ， 此 


时 的 查找 结果 用 一 个 “ 空 记录 ”或 “ 空 指针 ”表示 。 


( 
较 ”。 


5) 平均 查找 长 度 。 对 于 查找 算法 来 说 ， 其 基本 操作 是 “将 记录 的 关键 字 与 给 定 值 进 行 比 
此 ， 通 常 以 “其 关键 字 和 给 定 值 进 行 过 比较 的 记录 个 数 的 平均 值 ”作为 衡量 查找 算法 


好 坏 的 依据 。 
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为 确定 记录 在 查找 表 中 的 位 置 ， 需 和 给 定 值 进 行 比较 的 关键 字 个 数 的 期 望 值 称 为 查找 算法 
在 查找 成 功 时 的 平均 查找 长 度 。 
对 于 含有 n 个 记录 的 表 ， 查 找 成 功 时 的 平均 查找 长 度 定义 为 
ASL = YPc, 


i=l 


其 中 ， 忆 为 对 表 中 第 i 个 记录 进行 查找 的 概率 ， 且 六 忆 =1， 一 般 情况 下 ， 认 为 查找 每 个 记录 
i=] 


的 概率 是 相等 的 ， 即 P=1/n; Ci 为 找到 表 中 其 关键 字 与 给 定 值 相等 的 记录 时 (为 第 i 个 记录 )， 
和 给 定 值 已 进行 过 比较 的 关键 字 个 数 。 显 然 ，C; 随 查找 方法 的 不 同 而 不 同 。 


2. 顺序 查找 


从 表 中 的 一 端 开始 ， 逐 个 进行 记录 的 关键 字 和 给 定 值 的 比较 ， 若 找到 一 个 记录 的 关键 字 与 
给 定 值 相等 ， 则 查找 成 功 ， 若 整个 表 中 的 记录 均 比 较 过 ， 仍 未 找到 关键 字 等 于 给 定 值 的 记录 ， 
则 查找 失败 。 

顺序 查找 的 方法 对 于 顺序 存储 和 链 式 存储 方式 的 查找 表 都 适用 。 

从 顺序 查找 的 过 程 可 见 ，C; 取 决 于 所 查 记 录 在 表 中 的 位 置 。 若 需 查 找 的 记录 正好 是 表 中 的 
第 一 个 记录 时 ， 仅 需 比 较 一 次 ， 若 查找 成 功 时 找到 的 是 表 中 的 最 后 一 个 记录 ， 则 需 比 较 n 次 。 
一 般 情况 下 ，C==n-it1， 因 此 在 等 概率 情况 下 ， 顺 序 查找 成 功 的 平均 查找 长 度 为 


y LE 
ASLs = RC = ritD)= 


各 

也 就 是 说 ， 成 功 查 找 的 平均 比较 次 数 约 为 表 长 的 一 半 。 若 所 查 记录 不 在 表 中 ， 则 至 少 进行 
n 次 比较 才能 确定 失败 。 

与 其 他 查找 方法 相 比 , 顺序 查找 方法 在 n 值 较 大 时 , 其 平均 查找 长 度 较 大 , 查找 效率 较 低 。 
但 这 种 方法 也 有 优点 ， 那 就 是 算法 简单 且 适 应 面 广 ， 对 查找 表 的 结构 没有 要 求 ， 无 论 记录 是 否 
按 关键 字 有 序 排列 均 可 应 用 。 


3. 折 半 查找 


折 半 查找 也 称 为 二 分 查找 ， 其 基本 思想 是 : 先 令 查找 表 中 间 位 置 记录 的 关键 字 和 给 定 值 比 
较 ， 若 相等 ， 则 查找 成 功 ， 若 不 等 ， 则 缩小 范围 ， 直 至 新 的 查找 区 间 中 间 位 置 记录 的 关键 字 等 
于 给 定 值 或 者 查找 区 间 没 有 元 素 时 表明 查找 不 成 功 ) 为 止 。 

设 查 找 表 的 元 素 存 储 在 一 维 数 组 r[1..n] 中 ,那么 在 表 中 的 元 素 已 经 按 关键 字 递增 (或 递减 ) 
排序 的 情况 下 ， 进 行 折 半 查找 的 方法 是 : 首先 比较 key 值 与 表 r 中 间 位 置 ( 下 标 为 mid) 的 记 
录 的 关键 字 ， 若 相等 ， 则 查找 成 功 。 若 key>r[mid].key， 则 说 明 待 查 记 录 只 可 能 在 后 半 个 子 


i=] 
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表 rt[mid+1..n] 中 ,下 一 步 应 在 后 半 个 子 表 中 再 进行 折 半 查找 ; 若 key<r[mid].key, 说 明 待 查 记录 
只 可 能 在 前 半 个 子 表 r[1.mid-1] 中 ， 下 一 步 应 在 > 的 前 半 个 子 表 中 进行 折 半 查找 ， 这 样 通过 逐 
步 缩 小 范围 ， 直 到 查找 成 功 或 子 表 为 空 时 失败 为 止 。 

【函数 】 设 有 一 个 整 型 数组 中 的 元 素 是 按 非 递减 的 方式 排列 的 ， 在 其 中 进行 折 半 查找 的 算 
法 如 下 : 


int Bsearch(int r[],int low,int high,int key) 
人 # 元 素 存储 在 数组 r[low..high]， 用 折 半 查找 的 方法 在 数组 中 找 值 为 key 的 元 素 */ 
上 车 找到 则 返回 该 元 素 的 下 标 ， 否 则 返回 -1*/ 
{ intmid; 
while(low <= high) { 

mid = (low+high)/2 ; 

if (key == r[mid]) return mid; 

else if (key < rfmid]) high = mid-1; 

else low = mid+1l; 

/*while*/ 
return 一 1; 
MW/*Bsearch*/ 


折 半 查找 的 性 能 分 析 

折 半 查找 的 过 程 可 以 用 一 棵 二 又 树 描述 ,方法 是 以 当前 查找 区 间 的 中 间 位 置 上 的 记录 作 
为 根 ， 左 子 表 和 右 子 表 中 的 记录 分 别 作为 根 的 左 子 树 和 右 子 树 上 的 节点 ， 这 样 构造 的 二 又 树 称 
为 折 半 查找 判定 树 。 例 如 ， 具 有 11 个 节点 的 折 半 查找 判定 树 如 图 3-35 所 示 ， 节 点 中 的 数字 表 
示 元 素 的 序号 。 

从 折 半 查找 判定 树 可 以 看 出 ， 查 找 成 功 时 ， 折 半 查找 的 过 程 恰好 走 了 一 条 从 根 节点 到 被 查 
节点 的 路 径 ， 关 键 字 进 行 比较 的 次 数 即 为 被 查找 节点 在 树 中 的 层 数 。 因 此 ， 折 半 查 找 在 查找 成 
功 时 进行 比较 的 关键 字数 最 多 不 超过 树 的 高 度 , 而 具有 n 个 节点 的 判定 树 的 高 度 为 | log2n |+1， 


所 以 折 半 查找 在 查找 成 功 时 和 给 定 值 进 行 比较 的 关键 字 个 数 至 多 为 |logxz|+1。 

给 判定 树 中 所 有 节点 的 空 指针 域 加 上 一 个 指向 一 个 方 型 节点 的 指针 ， 称 这 些 方 型 节点 为 判 
定 树 的 外 部 节点 《与 之 相对 ， 称 那些 圆 形 节点 为 内 部 节点 )， 如 图 3-36 所 示 。 那 么 折 半 查找 不 
成 功 的 过 程 就 是 走 了 一 条 从 根 节点 到 外 部 节点 的 路 径 。 和 给 定 值 进行 比较 的 关键 字 个 数 等 于 该 
路 径 上 内 部 节点 个 数 。 因 此 ， 折 半 查 找 在 查找 不 成 功 时 和 给 定 值 进行 比较 的 关键 字 个 数 最 多 也 
不 会 超过 [logsn |+1 四 
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图 3-35 具有 11 个 节点 的 折 半 查找 判定 树 图 3-36 加 上 外 部 节点 的 判定 树 


那么 折 半 查找 的 平均 查找 长 度 是 多 少 昵 ?为 了 方便 起 见 ,不妨 设 节点 总 数 为 n=2 生 1， 则 判 
定 树 是 深度 为 h=log,(n+1) 的 满 二 又 树 。 在 等 概率 情况 下 ， 折 半 查 找 的 平均 查找 长 度 为 


ASL,, = 7c -oe 1 


当 n 值 较 大 时 ，ASL, 心 ee Ls 


折 半 查找 比 顺序 查找 的 效率 要 高 ， 但 它 要 求 查找 表 进 行 顺序 存储 并 且 按 关键 字 有 序 排列 。 
因此 ， 折 半 查 找 适用 于 表 不 易 变动 ， 且 又 经 常 进行 查找 的 情况 。 


4， 索引 顺序 查找 


索引 顺序 查找 又 称 分 块 查找 ， 是 对 顺序 查找 方法 的 一 种 改进 。 

在 分 块 查找 过 程 中 ， 首 先 将 表 分 成 若干 块 ， 每 一 块 中 关键 字 不 一 定 有 序 ， 但 块 之 间 是 有 序 
的 ， 即 后 一 块 中 所 有 记录 的 关键 字 均 大 于 前 一 个 块 中 最 大 的 关键 字 。 此 外 ， 还 建立 了 一 个 “ 索 
引 表 ”， 索 引 表 按 关键 字 有 序 ， 如 图 3-37 所 示 。 


最 大 关键 字 


起 始 地 址 回回 13 


61 |59|75|50|87|53 


23[13114]9 [of2113414314s139125 [49 


图 3-37 表 及 其 索引 表 
因此 ， 查 找 过 程 分 为 两 步 : 第 一 步 在 索引 表 中 确定 待 查 记录 所 在 的 块 ， 第 二 步 在 块 内 顺序 
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查找 。 

由 于 分 块 查找 实际 上 是 两 次 查找 的 过 程 ， 因 此 整个 分 块 查找 的 平均 查找 长 度 应 该 是 两 次 查 
找 的 平均 查找 长 度 〈 块 内 查找 与 索引 查找 ) 之 和 ， 所 以 分 块 查找 的 平均 查找 长 度 为 
ASL,, = 工 +,， 其 中 L 为 查找 索引 表 的 平均 查找 长 度 ，L, 为 块 内 查找 时 的 平均 查找 长 度 。 


进行 分 块 查找 时 可 将 长 度 为 n 的 表 均 匀 地 分 成 b 块 ， 每 块 含有 s 个 记录 ， mo-|2|. 在 


等 概率 的 情况 下 ， 抉 内 查找 的 概率 为 卫 ， 每 志 的 查找 概率 为 了 ， 若 用 顺序 查找 方法 确定 元 素 所 
在 的 块 ， 则 分 块 查找 的 平均 查找 长 度 为 


2 = l{(n 
ASL,, =L, +L, = st 2 = 一 一 + 一 一 -了 9 
可 见 , 其 平均 查找 长 度 在 这 种 条 件 下 不 仅 与 表 长 n 有 关 , 而 且 和 每 一 块 中 的 记录 数 * 有 关 。 
可 以 证 明 ， 当 s 取 Vn 时 ，A4SLs, 取 最 小 值 Vn+1， 这 时 的 查找 效率 较 顺序 查找 要 好 得 多 ， 但 远 
不 及 折 半 查找 。 


5. 树 表 查 找 


二 又 查找 树 、B- 树 、 红 黑 树 等 是 常见 的 以 树 表 方式 组 织 的 查找 表 ， 这 里 以 二 又 查找 树 为 例 
简要 介绍 树 表 上 的 查找 运算 。 二 又 查找 树 是 一 种 动态 查找 表 ， 其 特点 是 表 结 构 本 身 是 在 查找 过 
程 中 动态 生成 的 ， 即 对 于 给 定 值 key， 若 表 中 存在 关键 字 等 于 key 的 记录 ， 则 查找 成 功 返 回 
否则 插入 关键 字 等 于 key 的 记录 。 

根据 定义 ， 非 空 的 二 又 查找 树 中 左 子 树 上 所 有 节点 的 关键 字 均 小 于 根 节点 的 关键 字 ， 右 子 
树 上 所 有 节点 的 关键 字 均 大 于 根 节点 的 关键 字 ， 因 此 ， 可 将 二 又 查找 树 看 成 是 一 个 有 序 表 ， 其 
查找 过 程 与 折 半 查找 过 程 相 似 。 

1) 二 又 查找 树 的 查找 过 程 

在 二 又 查找 树 上 进行 查找 的 过 程 : 若 二 又 查找 树 非 空 ， 将 给 定 值 与 根 节点 的 关键 字 值 相 比 
较 ， 若 相等 ， 则 查找 成 功 ， 若 不 等 ， 则 当 根 节点 的 关键 字 值 大 于 给 定 值 时 ， 到 根 的 左 子 树 中 进 
行 查找 ， 否 则 到 根 的 右 子 树 中 进行 查找 。 若 找到 ， 则 查找 过 程 是 走 了 一 条 从 树 根 到 所 找到 节点 
的 路 径 ， 否 则 ， 查 找 过 程 终止 于 一 棵 空 树 。 

设 二 又 查找 树 以 二 又 链表 为 存储 结构 ， 节 点 的 类 型 定义 如 下 : 

typedef struct Tnode 

{ 


int data; /# 节 点 的 键 值 #/ 
struct Tnode #lchild,*rchild; 此 指向 左 、 右 子 树 的 指针 */ 
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}Tnode, *BiTree; 


【算法 】 二 又 查找 树 的 查找 算法 。 


Bitree SearchBST(BiTree root int key, BiTree *father) 
/# 在 root 指向 根 的 二 又 查找 树 中 查找 键 值 为 key 的 节点 */ 
/# 若 找到 ， 则 返回 该 节点 的 指针 ， 和 否则 返回 NULL%/ 
{ Bitree p=root;  *father=NULL; 
while (p && p->data!=key) 
{ 
*father = p; 
if (key <p->data) p = p->lchild; 
else p= p->rchild; 
}/*while*/ 
return p; 
}/*SearchBST*/ 
2) 二 又 查找 树 中 插入 节点 的 操作 
二 又 查找 树 是 通过 依次 输入 数据 元 素 并 把 它们 插入 到 二 又 树 的 适当 位 置 上 构造 起 来 的 ， 即 
每 读 入 一 个 元 素 ， 首 先 在 二 又 查找 树 中 进行 查找 ， 若 找到 则 不 再 插入 ， 否 则 根据 查找 时 得 到 的 
位 置信 息 进 行 插入 。 其 过 程 为 : 若 二 又 查找 树 为 空 ， 则 为 新 元 素 创建 节点 并 作为 二 又 查 找 树 的 
根 节 点 ; 若 二 又 查找 树 非 空 ， 则 将 新 元 素 的 值 与 根 节点 的 值 相 比 较 ， 如 果 小 于 根 节点 的 值 ， 则 
继续 在 左 子 树 中 查找 ， 否 则 在 右 子 树 中 继续 查找 ， 直 到 某 节点 的 值 与 新 元 素 的 值 相等 ， 或 者 到 
达 空 的 子 树 为 止 ， 此 时 创建 新 元 素 的 节点 并 替换 该 空 的 子 树 完成 插入 处 理 。 设 关键 字 序 列 为 
{46，25，54，13，29，91}， 则 对 应 的 二 又 查找 树 构造 过 程 如 图 3-38 (a) ~ 〈g) 所 示 。 


Wp Pa 


(a) (b) (c) (e) (DD (g) 
图 3-38 二 又 查找 树 的 构造 过 程 


从 上 面 的 插入 过 程 还 可 以 看 到 ， 每 次 插入 的 新 节点 都 是 二 又 查找 树 上 新 的 叶子 节点 ， 因 此 
在 进行 插入 操作 时 ， 不 必 移 动 其 他 节点 ， 仅 需 改 动 某 个 节点 的 指针 域 ， 由 空 变 为 非 空 即 可 。 这 
就 相当 于 在 一 个 有 序 序 列 上 插入 一 个 记录 而 不 需要 移动 其 他 记录 。 
另外 ， 由 于 一 棵 二 又 查找 树 的 形态 完全 由 输入 序列 决定 ， 所 以 在 输入 序列 已 经 有 序 的 情况 
下 ， 所 构造 的 二 又 查找 树 是 一 棵 单 枝 树 。 从 二 又 查找 树 的 查找 过 程 可 知 ， 这 种 情况 下 的 查找 效 
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率 与 顺序 查找 的 效率 相当 。 
6， 险 希 查找 


对 于 前 面 讨论 的 几 种 查找 方法 ， 由 于 记录 的 存储 位 置 与 其 关键 码 之 间 不 存在 确定 的 关系 ， 
所 以 查找 时 都 要 通过 一 系列 对 关键 字 的 比较 ， 才 能 确定 被 查 记录 在 表 中 的 位 置 ， 即 这 类 查找 方 
法 都 建立 在 对 关键 字 进 行 比较 的 基础 之 上 。 理 想 的 情况 是 依据 记录 的 关键 码 直接 得 到 对 应 的 存 
储 位 置 ， 即 要 求 记录 的 关键 码 与 其 存储 位 置 之 间 存在 一 一 对 应 关系 ， 通 过 这 个 关系 ， 能 很 快 地 
由 关键 码 找到 记录 。 哈 希 表 就 是 按 这 种 思想 组 织 的 查找 表 。 

1) 哈 希 造 表 

根据 设 定 的 哈 希 函数 Hash(key) 和 处 理 冲突 的 方法 ， 将 一 组 关键 字 映 射 到 一 个 有 限 的 连续 的 
地 址 集 (区 间 ) 上 ， 并 以 关键 字 在 地 址 集中 的 “ 像 ” 作 为 记录 在 表 中 的 存储 位 置 ， 这 种 表 称 为 
哈 希 表 ， 这 一 映射 过 程 称 为 哈 希 造 表 或 散 列 ， 所 得 的 存储 位 置 称 为 哈 希 地 址 或 散 列 地 址 。 

在 构造 哈 希 表 时 ， 是 以 记录 的 关键 字 为 自 变量 计算 一 个 函数 〈 称 为 哈 希 函数 ) 来 得 到 该 记 
录 的 存储 地 址 并 存 入 元 素 ， 因 此 在 哈 希 表 中 进行 查找 操作 时 ， 必 须 计 算 同 一 个 哈 希 函数 ， 首 先 
得 到 待 查 记录 的 存储 地 址 ， 然 后 到 相应 的 存储 单元 去 获得 有 关 信息 再 判定 查找 是 否 成 功 。 

对 于 某 个 哈 希 函 数 Hash 和 两 个 关键 字 Kl 和 K,， 如 果 Ki#K; 而 Hash(K&)=Hash(K2)， 则 称 
为 出 现 了 冲突 ， 对 该 哈 希 函数 来 说 ，Ki 和 K; 则 称 为 同义词 。 

一 般 情况 下 ， 只 能 尽 可 能 地 减少 冲突 而 不 能 完全 避免 ， 所 以 在 建造 哈 希 表 时 不 仅 要 设 定 一 
个 “好 ”的 哈 希 函数 ， 而 且 要 设 定 一 种 处 理 冲 突 的 方法 。 

采用 哈 希 法 主要 考虑 的 两 个 问题 是 哈 希 函数 的 构造 和 冲突 的 解决 。 

2) 处 理 冲突 

解决 冲突 就 是 为 出 现 冲 突 的 关键 字 找 到 另 一 个 “ 空 ”的 哈 希 地 址 。 常 见 的 处 理 冲突 的 方法 
有 开放 定 址 法 、 链 地 址 法 (拉链 法 )、 再 哈 希 法 、 建 立 公共 溢出 区 法 等 ， 在 处 理 冲 突 的 过 程 中 ， 
可 能 得 到 一 个 地 址 序列 ， 记 为 H( 二 1, 2,，…, 月 。 下 面 简要 介绍 开放 定 址 法 和 链 地 址 法 。 

(1) 开放 定 址 法 。 

HA(Hash(key)}+d) % mm 天 1 2，…, 大 (Ko 

其 中 ，Hash(key) 为 哈 希 函数 ，m 为 哈 希 表 的 表 长 ;为 增 量 序列 。 

常见 的 增 量 序列 有 如 下 三 种 。 

。 di=1,2,3，…,m-1， 称 为 线性 探测 再 散 列 。 

edi= 1 -12 22-22 32 …，+K (kxm/2)， 称 为 二 次 探测 再 散 列 。 

。 “qd;= 伪 随机 序列 ， 称 为 随机 探测 再 散 列 。 

最 简单 的 产生 探测 序列 的 方法 是 进行 线性 探测 。 也 就 是 发 生 冲 突 时 ,顺序 地 到 存储 区 的 下 
一 个 单元 进行 探测 。 


网 
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例如 ， 某 记录 的 关键 字 为 key， 哈 希 函 数值 Hl(key)=j。 若 在 哈 希 地 址 j 发 生 了 冲突 ( 即 此 
位 置 已 存放 了 其 他 元 素 ), 则 对 哈 希 地 址 j+1 进行 探测 , 若 仍然 有 冲突 , 再 对 地 址 j+2 进行 探测 ， 
以 此 类 推 ， 直 到 将 元 素 存 入 哈 希 表 。 

【 例 3.3】 设 关键 码 序 列 为 47，34，19，12，52，38，33，57，63，21， 哈 希 表 表 长 为 13， 
哈 希 函数 为 Hash(key)=key mod 11， 用 线性 探测 法 解决 冲突 构造 哈 希 表 。 

Hash(47)= 47 MOD 11 =3, Hash(34)=34 MOD 11= 1， 

Hash(19)= 19 MOD 11=8, Hash(12)=12MOD11=1, 

Hash(52) = 52 MOD 11 = 8， Hash(38)=38 MOD 11=5, 

Hash(33)= 33 MOD 11 =0， Hash(57)=57 MOD 11=2, 

Hash(63) = 63 MOD 11 = 8， Hash(21)=21 MOD 11=10 

使 用 线性 探测 法 解决 冲突 构造 哈 希 表 的 过 程 如 下 。 

(a) 开始 时 哈 希 表 为 空 表 。 

| 哈 希 地 址 | 0 | 1 | 2 | 3 |415|6517|819|10|D2 
[ 关 链 得 | | | | | | | [| | 

(b) 根据 哈 希 函数 ， 计 算出 关键 码 47 的 哈 希 地 址 为 3， 在 该 单元 处 无 冲突 ， 因 此 插入 47。 
此 后 关键 码 34 和 19 需要 插入 的 哈 希 地 址 1 和 8 处 也 没有 冲突 ， 因 此 在 对 应 位 置 直接 插入 后 如 
下 所 示 。 

哈 希 地 址 1|2|3|4|5s|sl7|s|l9lan 
34| In| | [| | [wl | 

(c) 将 关键 码 12 存 入 哈 希 地 址 为 1 的 单元 时 发 生 冲 突 ， 探 测 下 一 个 单元 ( 即 哈 希 地 址 为 2 
的 单元 )， 不 再 冲突 ， 因 此 将 12 存 入 哈 希 地 址 为 2 的 单元 后 如 下 所 示 。 
哈 希 地 址 | 0 | 1| 2 | 3 |41516|17|s|l9liolulzp 


关键 码 34 | 12 | 47 19 


(d) 将 关键 码 52 存 入 哈 希 地 址 为 8 的 单元 时 发 生 冲 突 ， 探 测 下 一 个 单元 〈 即 哈 希 地 址 为 9 
的 单元 )， 不 再 冲突 ， 因 此 将 52 存 入 哈 希 地 址 为 9 的 单元 后 如 下 所 示 。 
哈 希 地 址 |0|1|12|13|14|15|16|17|18|9|10|11|12 
关键 码 34 | 12 | 47 19 | 52 


(e) 在 哈 希 地 址 为 5 的 单元 存 入 关键 码 38， 没 有 冲突 ; 在 哈 希 地 址 为 0 的 单元 中 存 入 关键 
码 33， 没 有 冲突 。 因 此 将 38 和 33 先后 存 入 哈 希 地 址 为 5 和 0 的 单元 后 如 下 所 示 。 


哈 希 地 址 |0|1|12|13|14|15|16|17|18|9|10|l1|12 
关键 可 |33|34|12|14| |38| | 11|s| 
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(f) 在 哈 希 地 址 为 2 的 单元 存 入 关键 码 57 时 发 生 冲 突 ， 探 测 下 一 个 单元 〈 即 哈 希 地 址 为 3 

的 单元 )， 仍 然 冲突 ， 再 探测 哈 希 地 址 为 4 的 单元 ， 不 再 冲突 ， 因 此 将 57 存 入 哈 希 地 址 为 4 的 

单元 后 如 下 所 示 。 

| 哈 希 地 址 | 0 | 1 | 2 | 3 | 4 15 |6|7|sl9|lilualzp 
关键 码 33 | 34 | 12 | 47 | 57 | 38 19 | 52 


(g) 在 哈 希 地 址 为 8 的 单元 存 入 关键 码 63 时 发 生 冲突 ， 探 测 下 一 个 单元 〈 即 哈 希 地 址 为 9 
的 单元 )， 仍 然 冲 突 ， 再 探测 哈 希 地 址 为 10 的 单元 ， 不 再 冲突 ， 因 此 将 63 存 入 哈 希 地 址 为 10 


的 单元 后 如 下 所 示 。 
[re 希 地 址 | 0 | 1| 231415|5|7s 9|iolnu 


12 


[ 基 负 四 | 33134|12|14 157138| | | 19| 52 


Ch) 在 哈 希 地 址 为 10 的 单元 存 入 关键 码 21 时 发 生 冲突 ， 用 线性 探测 法 解决 冲突 ， 算 出 哈 
希 地 址 11， 不 再 冲突 ， 因 此 将 21 存 入 哈 希 地 址 为 11 的 单元 后 如 下 所 示 ， 此 时 得 到 最 终 的 哈 希 表 。 
[地址 | 0 | 1 | 2 |3|415|5|7|s|9|nful 


[ 关 负 四 133|34|12|47 |57|38| | 19152163|21| 
线性 探测 法 可 能 使 第 个 哈 希 地 址 的 同义词 存 入 第 寺 1 个 哈 希 地 址 ， 这 样本 应 存 入 第 i+1 


个 哈 希 地 址 的 元 素 变 成 了 第 it2 个 哈 希 地 址 的 同义词 ，…… ， 因 此 ， 可 能 出 现 很 多 元 素 在 相 邻 
的 哈 希 地 址 上 “聚集 ”起 来 的 现象 ， 大 大 降低 了 查找 效率 。 为 此 ， 可 采用 二 次 探测 法 或 随机 探 
测 再 散 列 法 ， 以 降低 “聚集 ”现象 。 

(2) 链 地 址 法 。 

链 地 址 法 是 一 种 经 常 使 用 且 很 有 效 的 方法 。 它 将 具有 相同 哈 希 函数 值 的 记录 组 织 成 一 个 链 
表 ， 当 链 域 的 值 为 NULL 时 ， 表 示 已 没有 后 继 记录 。 

例如 ， 哈 希 表 表 长 为 11、 哈 希 函数 为 Hash(key)=key mod 11， 对 于 关键 码 序列 47，34，13， 


12，52，38，33，27，3， 使 用 链 地 址 法 构造 的 哈 希 表 如 图 3-39 所 示 。 
险 希 地 址 | 0 [ 1 |] 2 | 3 | 4 | 5 | 6 | 7 1 8 | 9 00 
指针 | | | 入 | | ^ ^ | 1 | 入 | ^ 
1 1 1 1 
33 34 13 || 47 38 52 
人 | 人 | A 
| | | 
12 3 27 
人 A 入 
图 3-39 用 链 地 址 法 解决 冲突 构造 哈 希 表 
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3) 哈 希 查 找 

在 线性 探测 法 解决 冲突 的 方式 下 ， 进 行 哈 希 查找 有 两 种 可 能 : 第 一 种 情况 是 在 某 一 位 置 上 
查 到 了 关键 字 等 于 key 的 记录 ， 查 找 成 功 ;第 二 种 情况 是 按 探测 序列 查 不 到 关键 字 为 key 的 记 
录 而 又 遇 到 了 空 单元 ， 这 时 表明 元 素 不 在 表 中 ， 表 示 查 找 失败 。 

在 用 链 地 址 法 解决 冲突 构造 的 哈 希 表 中 查找 元 素 ， 就 是 根据 哈 希 函数 得 到 元 素 所 在 链表 的 
头 指 针 ， 然 后 在 链表 中 进行 顺序 查找 的 过 程 。 


3.4.4 递归 算法 


递归 〈Recursion) 是 一 种 描述 和 解决 问题 的 基本 方法 ， 用 来 解决 可 归纳 描述 的 问题 ， 或 者 
是 可 分 解 为 结构 自 相似 的 问题 。 所 谓 结构 自 相 似 ， 是 指 构成 问题 的 部 分 与 问题 本 身 在 结构 上 相 
似 。 这 类 问题 具有 的 特点 : 整个 问题 的 解决 可 以 分 为 两 部 分 ， 第 一 部 分 是 一 些 特殊 或 基本 的 情 
况 ， 可 直接 解决 ;第 二 部 分 与 原 问题 相似 ， 可 用 类 似 的 方法 解决 ， 但 比 原 问题 的 规模 小 。 

由 于 第 二 部 分 比 整个 问题 的 规模 小 ， 所 以 每 次 递归 时 第 二 部 分 的 规模 都 在 缩小 ， 如 果 最 终 
缩小 为 第 一 部 分 的 情况 则 结束 递归 。 因 此 ， 通 过 递归 不 断 地 分 解 问题 ， 第 一 部 分 和 第 二 部 分 的 
解密 切 配合 ， 完 成 原 问题 的 求解 。 

这 类 问题 在 数学 中 很 常见 ， 例 如 求 1!。 


1 n=0 
t= pp n>0 


【算法 】 求 nl。 

long fact(int n) 

{ if(n=1) retum1; 第 一 部 分 ， 递 归 终 止 %/ 
else return n*fact(n-1); ”人 * 第 二 部 分 ， 递 归 前 进 */ 

} 


在 该 式 中 ，fn-1) 的 计算 与 原 问 题 fn) 的 计算 相似 ， 只 是 规模 更 小 。 

设 一 维 数组 4 的 元 素 4[k1]~~4[42] 中 存放 着 整数 , 用 递归 方法 求 出 它们 中 的 最 大 者 。 显然 ， 
车 1=kK2， 即 数组 中 只 有 1 个 元 素 ， 则 4[k1] 就 是 最 大 元 素 ， 若 有 1< 想 ， 则 用 类 似 的 方法 先 求 出 
A[k1+1]~~4[A2] 中 的 最 大 者 m， 然 后 令 m 与 4[K1] 进 行 比较 ， 二 者 中 的 最 大 者 即 为 所 求 。 

折 半 查找 的 过 程 也 可 用 递归 算法 描述 如 下 。 

【算法 】 设 有 一 个 整 型 数组 中 的 元 素 是 按 非 递减 的 方式 排列 的 ， 递 归 地 进行 折 半 查找 。 


int Bsearch_rec(int r[],int low,int high,int key) 
履 元 素 存 储 在 数组 r[low..high]， 用 折 半 查找 的 方法 在 数组 x 中 找 值 为 key 的 元 素 */ 
上 车 找到 则 返回 该 元 素 的 下 标 ， 否 则 返回 -1*/ 
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{ intmid; 
if (low <= high) { 
mid = (low+high)/2 ; 
if (key 一 r[mid]) return mid; 
else if (key < r[mid]) return Bsearch_2(r, low, mid-1, key); 
else return Bsearch 2(r, mid+l, high, key); 
}/*if*/ 
return 一 1; 
}/*Bsearch rec#/ 


【算法 】 用 递归 方法 求 4[K1]~4[2] 中 的 最 大 者 ， 并 作为 函数 值 返 


int maxint(int A[], int kl, int k2) ” /* 求 A[kl] 一 A[k2] 中 的 最 大 者 并 返回 电 / 
{ iflkl==k2)retum A[kl]; 
else{ 


回 


m= maxint(A,k1+1,k2); 
return (A[k1] > m) ? A[k1] : m; 
} 


}/* maxint */ 


二 又 树 是 用 递归 方式 定义 的 ， 因 此 关于 二 叉 树 的 运算 可 用 递归 算法 描述 。 例 如 ， 二 又 树 的 


高 度 可 定义 为 
0 空 二 叉 树 
二 叉 树 的 = 
lal 次 MAX( 左 子 树 的 高 度 ， 右 子 树 的 高 度 ) 。 非 空 二 又 村 

【算法 】 用 递归 方法 求 二 又 树 的 高 度 。 
int HeightBT(BiTree root) 
{* 二 叉 树 采用 二 又 链表 存储 ，root 指向 二 叉 树 的 根 节点 ， 求 解 并 返回 二 叉 树 的 高 度 */ 
if (root =— NULL) return 0; /# 空 二 叉 树 的 高 度 为 0*/ 
else 


{ LH= HeightBT(root->lchild); 人 # 求 根 节点 的 左 子 树 高 度 #/ 
RH = HeightBT(root->rchild); 人 # 求 根 节点 的 右 子 树 高 度 拟 
让 (LLH> RH) returmn LH + 1; 
else return RH + 1; 
} 
}/* HeightBT */ 
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3.4.5 图 的 相关 算法 


1. 求 最 小 生成 树 算 法 

1) 生成 树 的 概念 

设 图 G=(F， 司 是 个 连通 图 ， 如 果 其 子 图 是 一 棵 包含 G 的 所 有 顶点 的 树 ， 则 该 子 图 称 为 G 
的 生成 树 (Spanning Tree)。 

当 从 图 G 中 任 一 顶点 出 发 遍历 该 图 时 ， 会 将 边 集 E(G) 分 为 两 个 集合 4(G) 和 B(G)。 其 中 
4(@) 是 遍历 时 所 经 过 的 边 的 集合 ，B(G) 是 遍历 时 未 经 过 的 边 的 集合 。 显 然 ，Gi=(P 0 是 图 G 
的 子 图 ， 称 子 图 G1 为 连通 图 G 的 生成 树 。 图 3-40 所 示 的 是 图 及 其 生成 树 。 


0 0 0 
ea SN © 9 


dB (WW—A) dB 


(a) (b) 生成 树 (c) 非 生成 树 
图 3-40 一 个 无 向 图 的 生成 树 

对 于 及 n 个 顶点 的 连通 图 ， 至少 有 n-1 条 边 ， 而 生成 树 中 恰好 有 n-1 条 边 ， 所 以 连通 图 的 
生成 树 是 该 图 的 极 小 连通 子 图 。 若 在 图 的 生成 树 中 任意 加 一 条 边 ， 则 必然 形成 回路 。 
图 的 生成 树 不 是 唯一 的 。 从 不 同 的 顶点 出 发 ， 选 择 不 同 的 存储 方式 和 遍历 方式 ， 可 以 得 到 
不 同 的 生成 树 。 对 于 非 连通 图 而 言 ， 每 个 连通 分 量 中 的 顶点 集 和 遍历 时 走 过 的 边 集 一 起 构成 若 
干 棵 生成 树 ， 把 它们 称 为 非 连通 图 的 生成 树 森林 。 
2) 最 小 生成 树 
对 于 连通 网 来 说 ， 边 是 带 权 值 的 ， 生 成 树 的 各 边 也 带 权 值 ， 于 是 就 把 生成 树 各 边 的 权 值 总 
和 称 为 生成 树 的 权 , 把 权 值 最 小 的 生成 树 称 为 最 小 生成 树 。 求解 最 小 生成 树 有 许多 实际 的 应 用 。 
普 里 姆 (Prim) 算法 和 克 重 斯 卡尔 (Kruskal) 算法 是 两 种 常用 的 求 最 小 生成 树 的 算法 。 

(1) 普 里 姆 (Prim) 算法 思想 。 

假设 MXF(P 可 是 连通 网 ,7 瑟 是 YXY 上 最 小 生成 树 中 边 的 集合 。 算 法 从 顶点 集合 [天 {uo}j(wE 用、 
边 的 集合 TE={} 开 始 ， 重 复 执行 下 述 操 作 :， 在 所 有 xEU，vE VU 的 边 (u, v)EE 中 找 一 条 代价 
最 小 的 边 (wuo,vo)， 把 这 条 边 并 入 集合 TE， 同 时 将 ww 并 入 集合 U， 直 至 U=V 时 为 止 。 此 时 TE 中 
必 有 n-l1 条 边 ， 则 T=(F，{7E})) 为 入 的 最 小 生成 树 。 
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由 此 可 知 , 普 里 姆 算法 构造 最 小 生成 树 的 过 程 是 以 一 个 顶点 集合 U={uo} 作 初 态 , 不 断 寻找 
与 UU 中 顶点 相 邻 且 代 价 最 小 的 边 的 另 一 个 项 点， 扩充 U 集 合 直至 U=V 时 为 止 。 
普 里 姆 算法 构造 最 小 生成 树 的 过 程 如 图 3-41 所 示 。 


(a) (b) (c) 
(d) (e) (f) 


图 3-41 普 里 姆 算法 构造 最 小 生成 树 的 过 程 


(2) 克 鲁 斯 卡尔 〈Kruskal) 算法 思想 。 

克 和 鲁 斯 卡尔 求 最 小 生成 树 的 算法 思想 为 : 假设 连通 网 N=(V，E)， 令 最 小 生成 树 的 初始 状 
态 为 只 有 nn 个 顶点 而 无 边 的 非 连 通 图 T=(V，{})， 图 中 每 个 顶点 自 成 一 个 连通 分 量 。 在 EB 中选 
择 代价 最 小 的 边 ， 若 该 边 依附 的 顶点 落 在 7 中 不 同 的 连通 分 量 上 ， 则 将 此 边 加 入 到 7 中， 否则 
使 去 此 边 而 选择 下 一 条 代价 最 小 的 边 。 以 此 类 推 , 直至 了 中 所 有 顶点 都 在 同一 连通 分 量 上 为 止 。 
朋克 和 鲁 斯 卡尔 算法 构造 最 小 生成 树 的 过 程 如 图 3-42 所 示 。 

克 鲁 斯 卡尔 算法 的 时 间 复 杂 度 为 O(eloge)， 与 图 中 的 顶点 数 无 关 ， 因 此 该 算法 适合 于 求 边 


稀疏 的 网 的 最 小 生成 树 。 
@ @ 
1 © ! © 
@ © bh 
© © 
(c) 


四 © 


(b) 


3-42” 克 和 鲁 斯 卡尔 算法 构造 最 小 生成 树 的 过 程 
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图 3-42 克 和 鲁 斯 卡尔 算法 构造 最 小 生成 树 的 过 程 ( 续 ) 


2. 拓扑 排序 


1) AOV 网 

在 工程 领域 ， 一 个 大 的 工程 项 目 通常 被 划分 为 许多 较 小 的 子 工程 〈 称 为 活动 )， 当 这 些 子 
工程 都 完成 时 ， 整 个 工程 也 就 完成 了 。 若 以 顶点 表示 活动 , 用 有 向 边 表示 活动 之 间 的 优先 关系 ， 
则 称 这 样 的 有 向 图 为 以 顶点 表示 活动 的 网 (Activity On Vertex network，AOYV 网 )。 在 有 向 网 中 ， 
若 从 顶点 vi 到 顶点 六 有 一 条 有 向 路 径 ， 则 顶点 vi 是 vy 的 前 驱 ， 顶 点 是 vi 的 后 继 。 若 <vi，v> 
是 网 中 的 一 条 弧 ， 则 顶点 vi 是 vw 的 直接 前 驱 ， 顶 点 vw 是 六 的 直接 后 继 。AOV 网 中 的 弧 表 示 了 
活动 之 间 的 优先 关系 ， 也 可 以 说 是 一 种 活动 进行 时 的 制约 关系 。 

在 AOV 网 中 不 应 出 现 有 向 环 ， 若 存在 的 话 ， 则 意味 着 某 项 活动 必须 以 自身 任务 的 完成 为 
先决 条 件 ， 显 然 这 是 荒 廖 的 。 因 此 ， 若 要 检测 一 个 工程 划分 后 是 否 可 行 ， 首 先 就 应 检查 对 应 的 
AOV 网 是 否 存在 回路 。 检 测 的 方法 是 对 其 AOV 网 进行 拓扑 排序 。 

2) 拓扑 排序 

拓扑 排序 是 将 AOV 网 中 所 有 顶点 排 成 一 个 线性 序列 的 过 程 ， 并 且 该 序列 满足 : 若 在 AOV 
网 中 从 顶点 vi 到 有 一 条 路 径 ， 则 在 该 线性 序列 中 ， 顶 点 v; 必 然 在 顶点 之 前 。 

一 般 情况 下 ,假设 AOV 网 代表 一 个 工程 计划 ， 则 AOV 网 的 一 个 拓扑 排序 就 是 一 个 工程 
顺利 完成 的 可 行 方案 。 对 AOV 网 进行 拓扑 排序 的 方法 如 下 。 

(1) 在 AOV 网 中 选择 一 个 入 度 为 零 (没有 前 驱 ) 的 顶点 且 输 出 它 。 

(2) 从 网 中 删除 该 顶点 以 及 与 该 项 点 有 关 的 所 有 边 。 

(3) 重复 上 述 两 步 ， 直 至 网 中 不 存在 入 度 为 零 的 顶点 为 止 。 

按照 上 述 步 骤 进 行 拓扑 排序 的 过 程 如 图 3-43 所 示 ， 得 到 的 拓扑 序列 为 6,1,4,3,2,5。 显 然 ， 
对 有 向 图 进行 拓扑 排序 所 产生 的 拓扑 序列 有 可 能 是 多 种 。 
执行 的 结果 会 有 两 种 情况 : 一 种 是 所 有 项 点 已 输出 ， 此 时 整个 拓扑 排序 完成 ， 说 明 网 中 不 
存在 回路 :， 另 一 种 是 尚 有 未 输出 的 顶点 ， 剩 余 的 顶点 均 有 前 驱 项 点 ， 表 明 网 中 存在 回路 ， 拓 扑 
排序 无 法 进行 下 去 。 
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0 


(a) (b) Ce) (Cd) 
图 3-43 ”拓扑 排序 过 程 


3. 求 单 源 点 的 最 短路 径 算法 


(e) (DD 


所 谓 单 源 点 最 短路 径 ， 是 指 给 定 带 权 有 向 图 G 和 源 点 vo， 求 从 w 到 G 中 其 余 各 顶点 的 最 
短路 径 。 迪 杰 斯 特 拉 (Dijkstra) 提出 了 按 路 径 长 度 递增 的 次 序 产 生 最 短路 径 的 算法 ， 其 思想 是 : 
把 网 中 所 有 的 顶点 分 成 两 个 集合 5 和 7T，S 集合 的 初 态 只 包含 顶点 mw， 了 集合 的 初 态 包含 除 vo 
之 外 的 所 有 顶点 ， 凡 以 w 为 源 点 ， 已 经 确定 了 最 短路 径 的 终点 并 入 8 集合 中 ， 按 各 顶点 与 w 
间 最 短路 径 长 度 递增 的 次 序 ， 逐 个 把 了 集合 中 的 顶点 加 入 到 8 集合 中 去 。 

每 次 从 了 集合 选 出 一 个 顶点 zx 并 使 之 并 入 集合 8 后 〈 即 w 至 x 的 最 短路 径 已 找 出 )， 从 w 


到 了 集合 中 各 顶点 的 路 径 有 可 能 变 得 更 短 。 例 如 ， 对 于 了 集合 中 的 某 一 个 顶点 w 来 说 ， 其 已 甸 
的 最 短路 径 可 能 变 为 《vo,…, u, vi)， 其 中 的 … 仅 包含 5 中 的 顶点 。 对 了 集合 中 各 顶点 的 路 径 进 
行 考查 并 进行 必要 的 修改 后 ， 再 从 中 挑选 出 一 个 路 径 长 度 最 小 的 项 点， 从 了 集合 中 删除 它 ， 同 
时 将 其 并 入 38 集合。 重复 该 过 程 ， 就 能 求 出 源 点 到 其 余 各 顶点 的 最 短路 径 及 路 径 长 度 。 

在 图 3-44 所 示 的 有 向 网 中 ， 用 迪 杰 斯 特 拉 算 法 求解 顶点 及 到 达 其 余 顶 点 的 最 短路 径 的 过 


程 如 表 3-3 所 示 。 


co % 100 30 
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(a) 有 向 网 C (b) 网 C 的 邻接 矩阵 


图 3-44 有 向 网 G 及 其 邻接 矩阵 
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表 3-3 ” 迪 杰 斯 特 拉 算 法 求解 图 3-44(a) 顶点 内 到 了 所、 了 到、 内、 了 内、 也 最 短路 径 的 过 程 


终 点 第 5 步 
Ia oo 
万 

(Vo, 了 网 分) Voy, py) | (Vo, Fs, Vs Wy) 
30 30 
万 
(Vo, V3) (Vo, V3) 
和 60 50 
(Vo, Vs, Va) (Vo, Vs, Vy) 
六 10 
(Vo, V9) 
从 万 到 太 、 成、 
认 、 太 、 万 的 路 从 克 到 从 、 成 、 成 、| 从 多 到 i, 态 、 从 页 到 矶 、 肥 的 
到 的 路 径 中 ，( 配 ，| 到 的 路 径 中 ， 
笃 中 ，(Vo， 了 9) | 网 最 短 ， 将 顶点 太 | (Vo, 态 , VD 最 短 ， | 路径 中 ，(a， 久 ， 
说 明 | 最 短 ， 将 顶点 | .3 和 | 0 3 4 | 卫队 最短， 将 | 而 到 且 无 路 径 
A | 加 入 5 集合 , 并 且 更 | 将 项 点 及 加 入 S| 
万 加 入 5S 集 合 ， 新 也 到 | 合 ， 并 且 更 新 顶点 肪 加 入 5S 集 
并 且 更 新 区 到 i 了 到 、 Wo 到 Va Ee 并 更 合 
也 的 路 径 的 路 径 本 到 态 的 路 径 
集合 S| {yo, rs} {Vo, Vs, 3} {Vo, Vs, Vs, Va} {Vo, Vs, V3, Ve Po} 


wl 
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4.1 操作 系统 基础 知识 


计算 机 系统 中 的 软件 极为 丰富 ， 通 常 分 为 系统 软件 和 应 用 软件 两 大 类 。 系 统 软件 是 计算 机 
系统 的 一 部 分 ， 由 它 支持 应 用 软件 的 运行 。 应 用 软件 是 指 计算 机 用 户 利用 计算 机 的 软件 、 硬 件 
资源 为 某 一 专门 的 应 用 目的 而 开发 的 软件 。 例 如 ， 科 学 计算 、 工 程 设 计 、 数 据 处 理 、 事 务 处 理 
和 过 程控 制 等 方面 的 程序 ， 以 及 文字 处 理 软件 、 表 格 处 理 软件 、 辅 助 设 计 软件 (CAD) 和 实时 
处 理 软件 等 。 常 用 的 系统 软件 有 操作 系统 、 语 言 处 理 程序 、 链 接 程 序 、 诊 断 程序 和 数据 库 管理 
系统 等 。 操 作 系统 是 计算 机 系统 中 必 不 可 少 的 核心 系统 软件 ， 其 他 软件 是 建立 在 操作 系统 的 基 
础 上 ， 并 在 操作 系统 的 统一 管理 和 支持 下 运行 ， 是 用 户 与 计算 机 之 间 的 接口 。 


4.1.1 操作 系统 的 基本 概念 


1， 操 作 系 统 定义 及 作用 


传统 计算 机 系统 资源 分 为 硬件 资源 和 软件 资源 。 硬 件 资源 包括 中 央 处 理 机 、 存 储 器 和 输入 
/输出 设备 等 物理 设备 ; 软件 资源 是 以 文件 形式 保存 在 存储 器 上 的 程序 和 数据 等 信息 。 现 代 计算 
机 系统 资源 管理 范围 已 经 扩展 到 感知 、 能 源 、 通 信 资 源 和 服务 资源 。 本 教材 主要 介绍 传统 计算 
机 系统 资源 管理 。 

操作 系统 定义 : 能 有 效 地 组 织 和 管理 系统 中 的 各 种 软 /硬件 资源 ， 合 理 地 组 织 计算 机 系统 工 
作 流 程 ， 控 制程 序 的 执行 ， 并 且 向 用 户 提供 一 个 良好 的 工作 环境 和 友好 的 接口 。 

操作 系统 有 两 个 重要 的 作用 : 第 一 ， 通 过 资源 管理 提高 计算 机 系统 的 效率 ; 第 二 ， 改 善人 
机 界面 向 用 户 提供 友好 的 工作 环境 。 

操作 系统 是 计算 机 系统 的 资源 管理 者 , 它 含 有 对 系统 软 /硬件 资源 实施 管理 的 一 组 程序 。 其 
首要 作用 就 是 通过 CPU 管理 、 存 储 管理 、 设 备 管理 和 文件 管理 对 各 种 资源 进行 合理 的 分 配 ， 改 
善 资源 的 共享 和 利用 程度 ， 最 大 限度 地 发 挥 计 算 机 系统 的 工作 效率 ， 提 高 计算 机 系统 在 单位 时 
间 内 处 理工 作 的 能 力 称 为 系统 的 “吞吐 量 (Throughput)”)。 

大 家 知道 ， 没 有 安装 操作 系统 的 计算 机 ， 用 户 将 要 面 对 的 是 0、1 代码 和 一 些 难 懂 的 机 器 
指令 ， 通 过 按钮 或 按键 来 操作 计算 机 ， 这 样 即 笨拙 又 费时 。 一 旦 安装 操作 系统 后 ， 用 户 面 对 的 
不 再 是 策 拙 的 裸 机 ， 而 是 操作 便利 、 服 务 周 到 的 操作 系统 ， 从 而 明显 地 改善 了 用 户 界面 ， 提 高 
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了 用 户 的 工作 效率 。 
2. 操作 系统 特征 与 功能 


操作 系统 的 4 个 特征 是 并 发 行 、 共 享 性 、 虚 拟 性 和 不 确定 性 。 从 传统 的 计算 机 资源 管理 的 
观点 来 看 ， 操 作 系 统 的 功能 可 分 为 处 理 机 管理 (也 称 进程 管理 )、 文 件 管理 、 存 储 管理 、 设 备 
管理 和 作业 管理 5 大 部 分 。 操 作 系 统 的 5 大 部 分 通过 相互 配合 、 协 调 工作 来 实现 对 计算 机 系统 
中 资源 的 管理 ， 控 制 任务 的 运行 。 

(1) 进程 管理 。 实 质 上 是 对 处 理 机 的 执行 “时 间 ” 进 行 管理 ， 采 用 多 道 程序 等 技术 将 CPU 
的 时 间 合 理 地 分 配给 每 个 任务 ， 主 要 包括 进程 控制 、 进 程 同步 、 进 程 通信 和 进程 调度 。 

(2) 文件 管理 。 主 要 包括 文件 存储 空间 管理 、 目 录 管 理 、 文 件 的 读 / 写 管理 和 存 取 控制 。 

(3) 存储 管理 。 存 储 管理 是 对 主 存储 器 “空间 ”进行 管理 ， 主 要 包括 存储 分 配 与 回收 、 存 
储 保护 、 地 址 映射 (变换) 和 主 存 扩充 。 

(4) 设备 管理 。 实 质 是 对 硬件 设备 的 管理 ， 包 括 对 输入 /输出 设备 的 分 配 、 启 动 、 完 成 和 


回 


可 收 


(5) 作业 管理 。 包 括 任务 、 界 面 管理 、 人 机 交互 、 图 形 界 面 、 语 音 控制 和 虚拟 现实 等 。 
操作 系统 提供 系统 命令 一 级 的 接口 ， 供 用 户 用 于 组 织 和 控制 自己 的 作业 运行 ， 如 命令 行 、 
菜单 式 或 GUI“ 联 机 ”、 命 令 脚 本 “ 脱 机 ”操作 系统 还 提供 编程 一 级 接口 ， 供 用 户 程序 和 系统 
程序 调用 操作 系统 功能 ， 如 系统 调用 和 高 级 语言 库 函 数 。 


4.1.2 ”操作 系统 分 类 及 特点 


通常 ， 操 作 系统 可 分 为 批 处 理 操作 系统 、 分 时 操作 系统 、 实 时 操作 系统 、 网 络 操作 系统 、 
分 布 式 操作 系统 、 微 机 操作 系统 和 巷 入 式 操作 系统 等 类 型 。 


1， 批 处 理 操 作 系 统 


批 处 理 操作 系统 分 为 单 道 批 处 理 和 多 道 批 处 理 。 

单 道 批 处 理 操作 系统 是 一 种 早期 的 操作 系统 ， 该 系统 可 以 提交 多 个 作业 ,“ 单 道 ” 的 含义 
是 指 一 次 只 有 一 个 作业 装 入 内 存 执行 。 作 业 由 用 户 程序 、 数 据 和 作业 说 明 书 〈 作 业 控制 语言 
3 个 部 分 组 成 。 当 一 个 作业 运行 结束 后 ， 随 即 自动 调 入 同 批 的 下 一 个 作业 ， 从 而 节省 了 作业 之 
间 的 人 工 干预 时 间 ， 提 高 了 资源 的 利用 率 。 

多 道 批 处 理 操作 系统 允许 多 个 作业 装 入 内 存 执行 ， 在 任意 一 个 时 刻 ， 作 业 都 处 于 开始 点 和 
终止 点 之 间 。 每 当 运行 中 的 一 个 作业 由 于 输入 /输出 操作 需要 调用 外 部 设备 时 ， 就 把 CPU 交 给 
另 一 个 等 待 运行 的 作业 ， 从 而 将 主机 与 外 部 设备 的 工作 由 串 行 改变 为 并 行 ， 进 一 步 避 免 了 因 主 
机 等 待 外 设 完成 任务 而 浪费 宝贵 的 CPU 时 间 。 多 道 批 处 理 系统 主要 有 3 个 特点 : 多 道 、 宏 观 上 
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并 行 运行 、 微 观 上 串 行 运行 。 
2. 分 时 操作 系统 


在 分 时 操作 系统 中 , 一 个 计算 机 系统 与 多 个 终端 设备 连接 。 分 时 操作 系统 是 将 CPU 的 工作 
时 间 划 分 为 许多 很 短 的 时 间 片 ， 轮 流 为 各 个 终端 的 用 户 服务 。 例 如 ， 一 个 带 20 个 终端 的 分 时 系 
统 ， 若 每 个 用 户 每 次 分 配 一 个 50ms 的 时 间 片 ， 则 每 隔 1s 即 可 为 所 有 的 用 户 服务 一 遍 。 因 此 ， 
尽管 各 个 终端 上 的 作业 是 断 续 地 运行 的 ， 但 由 于 操作 系统 每 次 对 用 户 程序 都 能 做 出 及 时 的 响 
应 ， 因 此 用 户 感觉 整个 系统 均 归 其 一 人 占用 。 

分 时 系统 主要 有 4 个 特点 : 多 路 性 、 独 立 性 、 交 互 性 和 及 时 人 性。 


3. 实时 操作 系统 


实时 是 指 计算 机 对 于 外 来 信息 能 够 以 足够 快 的 速度 进行 处 理 ， 并 在 被 控 对 象 允许 的 时 间 范 
围 内 做 出 快速 反应 。 实 时 系统 对 交互 能 力 要 求 不 高 ， 但 要 求 可 靠 性 有 保障 。 为 了 提高 系统 的 响 
应 时 间 ， 对 随机 发 生 的 外 部 事件 应 及 时 做 出 响应 并 对 其 进行 处 理 。 
实时 系统 分 为 实时 控制 系统 和 实时 信息 处 理 系统 。 实 时 控制 系统 主要 用 于 生产 过 程 的 自动 
控制 ， 例 如 数据 自动 采集 、 武 器 控制 、 火 炮 自动 控制 、 飞 机 自动 驾驶 和 导弹 的 制导 系统 等 。 实 
对 信息 处 理 系统 主要 用 于 实时 信息 处 理 ， 例 如 飞机 订 票 系统 、 情 报 检索 系统 等 。 实 时 系统 与 分 
系统 除了 应 用 的 环境 不 同 ， 主 要 有 以 下 三 点 区 别 。 

(1) 系统 的 设计 目标 不 同 。 分 时 系统 是 设计 成 一 个 多 用 户 的 通用 系统 ， 交 互 能 力 强 ; 而 实 
对 系统 大 多 是 专用 系统 。 

(2) 交互 性 的 强 弱 不 同 。 分 时 系统 是 多 用 户 的 通用 系统 ， 交 互 能 力 强 ， 而 实时 系统 是 专用 
系统 ， 仅 允许 操作 并 访问 有 限 的 专用 程序 ， 不 能 随便 修改 ， 且 交互 能 力 差 。 

(3) 响应 时 间 的 敏感 程度 不 同 。 分 时 系统 是 以 用 户 能 接受 的 等 待 时间 为 系统 的 设计 依据 ， 
而 实时 系统 是 以 被 测 物体 所 能 接受 的 延迟 为 系统 设计 依据 。 因 此 ， 实 时 系统 对 响应 时 间 的 敏感 
程度 更 强 。 


4. 网络 操作 系统 


网 络 操作 系统 是 使 联网 计算 机 能 方便 而 有 效 地 共享 网 络 资源 ， 为 网 络 用 户 提供 各 种 服务 的 
软件 和 有 关 协 议 的 集合 。 因 此 ， 网 络 操作 系统 的 功能 主要 包括 高 效 、 可 靠 的 网 络 通信 ; 对 网 络 
中 共享 资源 (在 LAN 中 有 硬盘 、 打 印 机 等 ) 的 有 效 管理 ， 提 供电 子 邮件 、 文 件 传输 、 共 享 硬 
盘 和 打印 机 等 服务 ， 网 络 安全 管理 ， 提 供 互 操作 能 力 。 

计算 机 网 络 系统 除了 硬件 外 ， 还 需要 有 系统 软件 ， 二 者 结合 构成 计算 机 网 络 的 基础 平台 。 


过 
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操作 系统 是 最 重要 的 系统 软件 。 网 络 操作 系统 是 网 络 用 户 和 计算 机 网 络 之 间 的 一 个 接口 ， 它 除 
了 应 具备 通常 操作 系统 应 具备 的 基本 功能 外 ， 还 应 有 联网 功能 ， 支 持 网 络 体系 结构 和 各 种 网 络 
通信 协议 ， 提 供 网 络 互联 功能 ， 支 持 有 效 、 可 靠 安全 的 数据 传送 。 

一 个 典型 的 网 络 操作 系统 的 特征 包括 硬件 独立 性 、 多 用 户 支持 等 。 其 中 ， 硬 件 独立 性 是 指 
网 络 操作 系统 可 以 运行 在 不 同 的 网 络 硬件 上 ， 可 以 通过 网 桥 或 路 由 器 与 别 的 网 络 连接 ， 多 用 
户 支持 ， 应 能 同时 支持 多 个 用 户 对 网 络 的 访问 ， 应 对 信息 资源 提供 完全 的 安全 和 保护 功能 

支持 网 络 实用 程序 及 其 管理 功能 ， 如 系统 备份 、 安 全 管理 、 容 错 和 性 能 控制 ， 多 种 客户 端 支 
持 ， 如 Windows NT 网 络 操 作 系 统 包括 OS/2、Windows 98 和 UNIX 等 多 种 客户 端 ， 极 大 地 方 
便 了 网 络 用 户 ; 提供 目录 服务 ， 以 单一 逻辑 的 方式 让 用 户 访问 位 于 世界 范围 内 的 所 有 网 络 服 
务 和 资源 的 技术 ;支持 多 种 增值 服务 ， 如 文件 服务 、 打 印 服 务 、 通 信服 务 和 数据 库 服务 等 。 

网 络 操作 系统 可 分 为 如 下 三 类 。 

(1) 集中 模式 。 集 中 式 网 络 操作 系统 是 由 分 时 操作 系统 加 上 网 络 功能 演变 而 来 的 ， 系 统 的 
基本 单元 由 一 台 主 机 和 若干 台 与 主机 相连 的 终端 构成 ， 将 多 台 主 机 连接 起 来 形成 了 网 络 ， 信 息 
的 处 理 和 控制 是 集中 的 。UNIX 就 是 这 类 系统 的 典型 例子 。 

(2) 客户 端 /服务 器 模式 。 这 是 流行 的 网 络 工作 模式 , 该 种 模式 网 络 可 分 为 服务 器 和 客户 端 。 
服务 器 是 网 络 的 控制 中 心 ， 其 任务 是 向 客户 端 提 供 一 种 或 多 种 服务 ， 服 务 器 可 有 多 种 类 型 ， 如 
提供 文件 /打印 服务 的 文件 服务 器 等 。 客户 端 是 用 于 本 地 处 理 和 访问 服务 器 的 站 点 , 在 客户 端 中 
包含 了 本 地 处 理 软 件 和 访问 服务 器 上 服务 程序 的 软件 接口 。 

(3) 对 等 模式 (Peer-To-Peer) 模式 。 在 采用 这 种 模式 的 操作 系统 网 络 中 ， 各 个 站 点 是 对 等 
的 。 它 既 可 作为 客户 端 去 访问 其 他 站 点 ， 又 可 作为 服务 器 向 其 他 站 点 提供 服务 ， 在 网 络 中 既 无 
服务 处 理 中 心 ， 也 无 控制 中 心 ， 或 者 说 ， 网 络 的 服务 和 控制 功能 分 布 在 各 个 站 点 上 。 可 见 ， 该 
模式 具有 分 布 处 理 及 分 布控 制 的 特征 。 

现代 操作 系统 已 把 网 络 功能 包含 到 操作 系统 的 内 核 中 ， 作 为 操作 系统 核心 功能 的 一 个 组 成 
部 分 。Microsoft 公司 的 Windows NT、AT &T 公司 的 UNIX SystemV、Sun 公司 的 SunOS、HP 
公司 的 HP/OX、IBM 公司 的 AIX 和 Linux 等 都 已 把 TCP/IP 网 络 功能 包含 在 内 核 中 。 

网 络 操作 系统 是 整个 网 络 的 灵魂 ， 它 决定 了 网 络 的 功能 ， 并 由 此 决定 了 不 同 网 络 的 应 用 领 
域 及 方向 。 目 前 ， 网 络 操作 系统 主要 有 三 大 阵营 : UNIX、Windows NT 和 NetWare。 各 种 网 络 
操作 系统 具有 不 同 的 特点 ， 随 着 网 络 技术 的 发 展 ， 新 的 网 络 操作 系统 还 会 不 断 出 现 ， 用 户 可 根 
据 自 己 的 需要 进行 选择 ， 而 不 要 仅 局 限于 其 技术 水 平 的 高 低 。 


S. 分 布 式 操作 系统 
分 布 式 计算 机 系统 是 由 多 个 分 散 的 计算 机 经 连接 而 成 的 计算 机 系统 ， 系 统 中 的 计算 机 无 
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主 、 次 之 分 ， 任 意 两 台 计 算 机 可 以 通过 通信 交换 信息 。 通 常 ， 为 分 布 式 计算 机 系统 配置 的 操作 
系统 称 为 分 布 式 操作 系统 。 

分 布 式 操作 系统 能 直接 对 系统 中 的 各 类 资源 进行 动态 分 配 和 调度 、 任 务 划 分 、 信 息 传输 协 
调 工作 ， 并 为 用 户 提供 一 个 统一 的 界面 、 标 准 的 接口 ， 用 户 通过 这 一 界面 实现 所 需要 的 操作 和 
使 用 系统 资源 ， 使 系统 中 若干 台 计 算 机 相互 协作 完成 共同 的 任务 ， 有 效 地 控制 和 协调 诸 任务 的 
并 行 执行 ， 并 向 系统 提供 统一 、 有 效 的 接口 的 软件 集合 。 

分 布 式 操作 系统 是 网 络 操作 系统 的 更 高 级 形式 ， 它 保持 网 络 系统 所 拥有 的 全 部 功能 ， 同 时 
又 有 透明 性 、 可 靠 性 和 高 性 能 等 特性 。 


6. 微型 计算 机 操作 系统 


微型 计算 机 操作 系统 简称 微机 操作 系统 ， 常 用 的 有 Windows、Mac OS、Linux。Windows 
操作 系统 是 Microsoft 公司 开发 的 图 形 用 户 界面 、 多 任务 、 多 线程 操作 系统 。Mac OS 操作 系统 
是 美国 苹果 计算 机 公司 为 它 的 Macintosh 计算 机 设计 的 操作 系统 的 一 代 操作 系统 ， 该 机 型 于 
1984 年 推出 ， 率 先 采 用 了 一 些 我 们 至 今 仍 为 人 称道 的 技术 ， 如 : GUI 图 形 用 户 界面 、 多 媒体 应 
用 、 鼠 标 等 。Linux 是 一 套 免费 使 用 并 可 自由 传播 的 类 UNIX 操作 系统 ， 由 世界 各 地 成 千 上 万 
的 程序 员 设计 和 实现 ， 其 目的 是 建立 不 受 任何 商品 化 软件 版 权 制 约 的 、 全 世界 都 能 自由 使 用 的 
UNIX 兼容 产品 。 


7. 嵌入 式 操作 系统 


嵌入 式 操 作 系统 运行 在 嵌入 式 智 能 芯片 环境 中 ， 对 整个 智能 芯片 以 及 它 所 操作 、 控 制 的 各 
种 部 件 装 置 等 资源 进行 统一 协调 、 处 理 、 指 挥 和 控制 。 其 主要 特点 如 下 : 

(1) 微型 化 。 从 性 能 和 成 本 角度 考虑 ， 希 望 占用 的 资源 和 系统 代码 量 少 ， 如 内 存 少 、 字 长 
短 、 运 行 速度 有 限 、 能 源 少 ( 用 微小 型 电池 )。 

(2) 可 定制 。 从 减少 成 本 和 缩短 研发 周期 考虑 ， 要 求 嵌入 式 操作 系统 能 运行 在 不 同 的 微 处 
理 器 平台 上 ， 能 针对 硬件 变化 进行 结构 与 功能 上 的 配置 ， 以 满足 不 同 应 用 需要 。 

(3) 实时 性 。 顽 入 式 操 作 系统 主要 应 用 于 过 程控 制 、 数 据 采 集 、 传 输 通 信 、 多 媒体 信息 及 
关键 要 害 领域 需要 迅速 响应 的 场合 ， 所 以 对 实时 性 要 求 较 高 。 

(4) 可 靠 性 。 系 统 构件 、 模 块 和 体系 结构 必须 达到 应 有 的 可 靠 性 ， 对 关键 要 害 应 用 还 要 提 
供 容错 和 防 故 障 措施 。 

(5) 易 移植 性 .为 了 提高 系统 的 易 移植 性 ,通常 采用 硬件 抽象 层 (Hardware Abstraction Level， 
HAL) 和 板 级 支撑 包 〈(Board Support Package，BSP) 的 底层 设计 技术 。 

媒 入 式 实时 操作 系统 有 很 多 , 常见 的 有 VxWorks、hClinux、 PalmOS、Windows CE、 nC/OS-II 
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和 eCos 等 。 
4.1.3 ”操作 系统 的 发 展 


操作 系统 是 在 人 们 不 断 地 改善 计算 机 系统 性 能 和 提高 资源 利用 率 的 过 程 中 逐步 地 形成 和 
发 展 起 来 的 。 推 动 操作 系统 发 展 的 主要 动力 是 “需求 推动 发 展 ”。 回 顾 计算 机 的 发 展 历史 ， 用 
户 就 会 发 现 操作 系统 的 重大 改进 与 计算 机 硬件 的 更 新 换代 相 吻 合 。 因 此 ， 计 算 机 各 代 的 划分 主 
要 是 以 硬件 和 操作 系统 软件 技术 的 创新 为 标志 。 每 当 对 操作 系统 做 出 新 的 关键 性 需求 分 析 时 ， 
这 些 新 的 需求 有 些 必须 得 到 计算 机 系统 的 硬件 支持 。 任 何事 物 都 是 在 不 断 解决 问题 的 过 程 中 向 
前 发 展 的 ， 作 为 新 一 代 计 算 机 系统 除了 要 继承 上 一 代 的 全 部 优点 外 ， 更 重要 的 是 克服 上 一 代 存 
在 的 问题 和 不 足 ， 与 此 同时 ， 新 的 设计 理论 和 技术 又 会 产生 许多 新 的 有 待 解决 的 问题 。 
促使 操作 系统 发 展 的 因素 主要 有 3 个 方面 : 第 一 ， 硬 件 的 不 断 升 级 与 新 的 硬件 产品 出 现 ， 
需要 操作 系统 提供 更 多 、 更 复杂 的 支持 ， 第 二 ， 新 的 服务 需求 ， 操 作 系统 为 了 满足 系统 管理 者 
和 用 户 需求 ， 需 要 不 断 扩大 服务 范围 ， 第 三 ， 修 补 操作 系统 自身 的 错误 ， 操 作 系统 在 运行 的 过 
程 中 其 自身 的 错误 也 会 不 断 地 被 发 现 , 因此 需要 不 断 地 修补 操作 系统 自身 的 错误 ( 即 所 谓 的 “ 补 
丁 ”)。 需 要 说 明 的 是 ， 在 修补 的 过 程 中 也 可 能 会 产生 新 的 错误 。 


4.2 ”进程 管理 


进程 管理 也 称 处 理 机 管理 。 引 入 进程 的 原因 : 在 多 道 程序 批 处 理 系统 和 分 时 系统 中 有 多 个 
并 发 执行 的 程序 ， 采 用 程序 已 无 法 描述 系统 中 程序 执行 时 动态 变化 的 过 程 。 进 程 是 资源 分 配 和 
独立 运行 的 基本 单位 。 进 程 管理 重点 需要 研究 诸 进 程 之 间 的 并 发 特性 ， 以 及 进程 之 间 相 互 合作 
与 资源 竞争 产生 的 问题 。 
4.2.1 基本 概念 

1. 程序 与 进程 

1) 程序 顺序 执行 的 特征 

前 趋 图 是 一 个 有 向 无 循环 图 ， 由 节点 和 有 向 边 组 成 ， 节 点 代表 各 程序 段 的 操作 ， 而 节点 间 


的 有 向 边 表示 两 个 程序 段 操作 之 间 存在 的 前 趋 关系 一)。 程 序 段 P; 和 P 的 前 趋 关系 表示 成 
PPj， 其 中 ，P 是 的 前 趋 ，P) 是 了 ,的 后 继 ， 其 含义 是 P， 


执行 结束 后 才能 执行 。 例 如 ， 图 4-1 为 3 个 程序 段 ， 其 


中 输入 是 计算 的 前 驱 ( 计 算是 输入 的 后 继 )， 输 入 结束 才能 Da 
进行 计算 ， 计 算是 输出 的 前 驱 ， 计 算 结束 才能 进行 输出 。 图 4.1 3 个 节点 的 前 驱 图 
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程序 顺序 执行 时 的 主要 特征 包括 顺序 性 、 封 闭 性 和 可 再 现 性 。 

2) 程序 并 发 执行 的 特征 

若 在 计算 机 系统 中 采用 多 道 程序 设计 技术 ， 则 主 存 中 的 多 道 程序 可 处 于 并 发 执行 状态 。 对 
于 上 述 有 3 个 程序 段 的 作业 类 ， 虽 然 每 个 作业 有 前 趋 关 系 的 各 程序 段 不 能 在 CPU 和 输入 /输出 
各 部 件 并 行 执行 ， 但 是 同一 个 作业 内 没有 前 趋 关系 的 程序 段 或 不 同 作业 的 程序 段 可 以 分 别 在 
CPU 和 各 输入 /输出 部 件 上 并 行 执行 。 例 如 ， 某 系统 中 有 一 个 CPU、 一 台 输 入 设备 和 一 台 输 出 
设备 ,每 个 作业 具有 3 个 程序 段 输 入 I, 计算 Ci 和 输出 PA( 二 1,2,3)。 图 4-2 为 3 个 作业 的 各 程序 
段 并 发 执行 的 前 驱 图 。 
从 图 4-2 中 可 以 看 出 ，E 与 Ci 并行 执行 ， B、C: 与 P; 并行 执行 ， C3 与 P; 并 行 执行 。 其 中 ， 
DP、D 受到 Ti 的 间接 制约 ，Cz、C3 受到 Ci 的 间接 制约 ， P,、P; 受 到 P; 的 间接 制约 ， 而 Cl、P1 
受到 了 的 直接 制约 ， 等 等 。 

程序 并 发 执行 时 的 特征 如 下 。 

(1) 失去 了 程序 的 封闭 性 。 


(2) 程序 和 机 器 的 执行 程序 的 活动 不 再 一 
一 对 应 。 
(3) 并 发 程序 间 的 相互 制约 性 。 
例如 ,两 个 并 发 执行 的 程序 段 完 成 交通 流 图 4-2 程序 并 发 执行 的 前 驱 图 
量 的 统计 ， 其 中 ,“ 观 察 者 ”Pi 识别 通过 的 车 辆 数 ,“ 报 告 者 ”P, 定时 将 观察 者 的 计数 值 清 0。 
程序 实现 如 下 。 
Pi P; 
L1: 这 有 车 通过 then L2: PRINT COUNT; 
COUNT:=COUNT+1; COUNT:=0; 
GOTO L1; GOTO L2; 


对 于 上 例 ， 由 于 程序 可 并 发 执行 ， 所 以 可 能 有 以 下 3 种 执行 序列 。 

© COUNT:=COUNT+1; PRINT COUNT; COUNT:=0 

©@ PRINT COUNT; COUNT:=0; COUNT:=COUNT+1 

@ PRINT COUNT; COUNT:=COUNT+1; COUNT:=0 

假定 COUNT 的 某 个 循环 的 初 值 为 nx， 那么 这 3 种 执行 序列 得 到 的 COUNT 结果 不 同 ， 如 


表 4-1 所 示 。 
表 4-1 程序 并 发 执行 的 结果 
执行 序列 © © 四 
COUNT 打印 的 值 n+l n | n 


COUNT 执行 后 的 值 0 1 0 
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这 种 不 正确 结果 的 发 生 是 因为 两 个 程序 P 和 PP 共享 变量 COUNT 引起 的 ， 即 程序 并 发 执 
行 破坏 了 程序 的 封闭 性 和 可 再 现 性 ， 使 得 程序 和 执行 程序 的 活动 不 再 一 一 对 应 。 为 了 解决 这 一 
问题 ， 需 要 研究 进程 间 的 同步 与 互 斥 问题 。 


2. 进程 的 组 成 


进程 是 程序 的 一 次 执行 ， 该 程序 可 以 和 其 他 程序 并 发 执行 。 进 程 通 常 是 由 程序 、 数 
据 和 进程 控制 块 (Process Control Block，PCB) 组 成 的 。 
(1) PCB。PCB 是 进程 存在 的 唯一 标志 ， 其 主要 内 容 如 表 4-2 所 示 。 


表 4-2 PCB 的 内 容 

言 ” 息 含 义 

进程 标识 符 标明 系统 中 的 各 个 进程 

状态 说 明 进 程 当前 的 状态 

位 置信 息 指明 程序 及 数据 在 主 存 或 外 存 的 物理 位 置 
控制 信息 参数 、 信 号 量 、 消 息 等 

队列 指针 链接 同一 状态 的 进程 
优先 级 进程 调度 的 依据 
现场 保护 区 将 处 理 机 的 现场 保护 到 该 区 域 ， 以 便 再 次 调度 时 能 继续 正确 运行 
其 他 因 不 同 的 系统 而 异 


(2) 程序 。 程 序 部 分 描述 了 进程 需要 完成 的 功能 。 假 如 一 个 程序 能 被 多 个 进程 同时 共 
享 执行 ， 那么 这 一 部 分 就 应 该 以 可 再 入 ( 纯 ) 码 的 形式 编制 ， 它 是 程序 执行 时 不 可 修 
改 的 部 分 。 

(3) 数据 。 数 据 部 分 包括 程序 执行 时 所 需 的 数据 及 工作 区 。 该 部 分 只 能 为 一 个 进程 所 专用 ， 
是 进程 的 可 修改 部 分 。 


3. 进程 的 状态 及 其 状态 间 的 切换 


1) 三 态 模 型 

在 多 道 程序 系统 中 ， 进 程 在 处 理 器 上 交替 运行 ， 状 态 也 不 断 地 发 生变 化 ， 因 此 进程 一 般 有 
3 种 基本 状态 : 运行、 就 绕 和 阻塞 。 图 4-3 显示 了 进程 基本 状态 及 其 转换 ， 也 称 三 态 模型 。 

(1) 运行 。 当 一 个 进程 在 处 理 机 上 运行 时 ， 则 称 该 进程 处 于 运行 状态 。 显 然 ， 对 于 单 处 理 
机 系统 ， 处 于 运行 状态 的 进程 只 有 一 个 。 

(2) 就 绕 。 一 个 进程 获得 了 除 处 理 机 外 的 一 切 所 需 资源 ， 一 旦 得 到 处 理 机 即 可 运行 ， 则 称 
此 进程 处 于 就 绪 状 态 。 
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(3) 阻塞 。 阻 塞 也 称 等 待 或 睡眠 状态 ， 一 个 进程 正在 等 待 某 一 事件 发 生 〈 例 如 请 求 IO 等 
待 IO 完成 等 ) 而 暂时 停止 运行 ， 这 时 即使 把 处 理 机 分 配给 进程 也 无 法 运行 ， 故 称 该 进程 处 于 
阻塞 状态 。 

2) 五 态 模 型 
事实 上 ， 对 于 一 个 实际 的 系统 ， 进 程 的 状态 及 其 转换 更 复杂 。 例 如 ， 引 入 新 建 态 和 终止 态 
构成 了 进程 的 五 态 模 型 ， 如 图 4-4 所 示 。 


时 间 片 到 


ceoc 
发 生 


图 4-3 ”进程 的 三 态 模型 图 4-4 ”进程 的 五 态 模型 


其 中 ， 新 建 态 对 应 于 进程 刚刚 被 创建 时 没有 被 提交 的 状态 ， 并 等 待 系统 完成 创建 进程 的 所 
有 必要 信息 。 因 为 创建 进程 时 分 为 两 个 阶段 ， 第 一 个 阶段 为 一 个 新 进程 创建 必要 的 管理 信息 ， 
第 二 个 阶段 让 该 进程 进入 就 绪 状 态 。 由 于 有 了 新 建 态 操作 系统 ， 往 往 可 以 根据 系统 的 性 能 和 主 
存 容量 的 限制 推迟 新 建 态 进程 的 提交 。 

类 似 地 ， 进 程 的 终止 也 可 分 为 两 个 阶段 ， 第 一 个 阶段 等 待 操作 系统 进行 善后 处 理 ， 第 二 个 
阶段 释放 主 存 。 

3) 具有 挂 起 状态 的 进程 状态 及 其 转换 

由 于 进程 的 不 断 创建 ， 系 统 资源 特别 是 主 存 资 
源 已 不 能 满足 进程 运行 的 要 求 。 这 时 ， 就 必须 将 某 
些 进程 挂 起 ， 放 到 磁盘 对 换 区 ， 暂 时 不 参加 调度 ， 


以 平衡 系统 负载 。 或 者 是 系统 出 现 故障 ， 或 者 是 用 胃 

户 调试 程序 ， 也 可 能 需要 将 进程 挂 起 检查 问题 。 图 J 

4-5 是 具有 挂 起 状态 的 进程 状态 及 其 转换 。 恢复 /等 待 事件 发 生 、\ 上 -二 恢复 
(1) 活跃 就 绪 。 活 跃 就 绪 是 指 进程 在 主 存 并 且 或 激活 / 挂 | | 或 激活 

可 被 调度 的 状态 。 


(2) 静止 就 绪 。 静 止 就 绪 是 指 就 绪 进 程 被 对 换 
到 辅 存 时 的 状态 ， 它 是 不 能 被 直接 调度 的 状态 ， 只 等 竺 四 康 村 公 生 
有 当主 存 中 没有 活跃 就 绪 态 进程 ， 或 者 是 挂 起 态 进 图 45 细 分 进程 状态 及 其 转换 
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程 具 有 更 高 的 优先 级 时 ， 系 统 将 把 挂 起 就 绪 态 进程 调 回 主 存 并 转换 为 活跃 就 绪 。 
(3) 活跃 阻塞 。 活 跃 阻塞 是 指 进程 在 主 存 ， 一 旦 等 待 的 事件 产生 便 进 入 活跃 就 绪 状 态 。 
(4) 静止 阻塞 。 静止 阻塞 是 指 阻塞 进程 对 换 到 辅 存 时 的 状态 ， 一 旦 等 待 的 事件 产生 便 进入 
静止 就 绪 状 态 。 


4.2.2 ”进程 的 控制 


进程 控制 就 是 对 系统 中 的 所 有 进程 从 创建 到 消亡 的 全 过 程 实施 有 效 的 控制 。 为 此 ， 操 作 系 
统 设置 了 一 套 控制 机 构 , 该 机 构 的 主要 功能 包括 创建 一 个 新 进程 , 撤销 一 个 已 经 运行 完 的 进程 ， 
改变 进程 的 状态 ， 实 现 进程 间 的 通信 。 进 程控 制 是 由 操作 系统 内 核 (Kernel) 中 的 原 语 实现 的 。 
内 核 是 计算 机 系统 硬件 的 首次 延伸 ， 是 基于 硬件 的 第 一 层 软 件 扩充 ， 它 为 系统 对 进程 进行 控制 
和 管理 提供 了 良好 的 环境 。 

原 语 〈Primitive) 是 指 由 若干 条 机 器 指令 组 成 的 ， 用 于 完成 特定 功能 的 程序 段 。 原 语 的 特 
点 是 在 执行 时 不 能 被 分 割 ， 即 原子 操作 要 么 都 做 ， 要 么 都 不 做 。 内 核 中 所 包含 的 原 语 主要 有 进 
程控 制 原 语 、 进 程 通信 原 语 、 资 源 管理 原 语 以 及 其 他 方面 的 原 语 。 属 于 进程 控制 方面 的 原 语 有 
进程 创建 原 语 、 进 程 撤销 原 语 、 进 程 挂 起 原 语 、 进 程 激 活 原 语 、 进 程 阻 塞 原 语 以 及 进程 唤醒 原 
语 等 。 不 同 的 操作 系统 内 核 所 包含 的 功能 不 同 ， 但 大 多 数 操作 系统 的 内 核 都 包含 支撑 功能 和 资 
源 管理 的 功能 。 


4.2.3 ”进程 间 的 通信 

在 多 道 程序 环境 的 系统 中 存在 多 个 可 以 并 发 执行 的 进程 ， 故 进程 间 必 然 存在 资源 共享 和 相互 
合作 的 问题 。 进 程 通信 是 指 各 个 进程 交换 信息 的 过 程 。 

1. 同步 与 互 斥 


同步 是 合作 进程 间 的 直接 制约 问题 ， 互 斥 是 申请 临界 资源 进程 间 的 间接 制约 问题 。 

1) 进程 间 的 同步 

在 计算 机 系统 中 ， 多 个 进程 可 以 并 发 执行 , 每 个 进程 都 以 各 自 独立 的 、 不 可 预知 的 速度 向 前 
推进 ， 但 是 需要 在 某 些 确定 点 上 协调 相互 合作 进程 间 的 工作 。 例 如 ， 进 程 A 向 缓冲 区 送 数据 ， 
进程 B 从 缓冲 区 取 数 据 加 工 ， 当 进程 B 要 取 数 据 加 工时 ， 必 须 是 进程 A 完成 了 向 缓冲 区 送 数 
据 的 操作 ， 否 则 进程 B 必须 停 下 来 等 待 进程 A 的 操作 结束 。 

可 见 ， 所 谓 进 程 间 的 同步 是 指 在 系统 中 一 些 需要 相互 合作 , 协同 工作 的 进程 ， 这样 的 相 
互联 系 称 为 进程 的 同步 。 
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2) 进程 间 的 互 斥 

进程 的 互 斥 是 指 系统 中 多 个 进程 因 争 用 临界 资源 而 互 斥 执行 。 在 多 道 程序 系统 环境 中 ， 
各 进程 可 以 共享 各 类 资源 ， 但 有 些 资源 一 次 只 能 供 一 个 进程 使 用 ， 称 为 临界 资源 〈Critical 
Resource，CR)， 如 打印 机 、 共 享 变量 和 表格 等 。 

3) 临界 区 管理 的 原则 

临界 区 (Critical Section，CS) 是 进程 中 对 临界 资源 实施 操作 的 那 段 程序 。 对 互 斥 临界 区 


管理 的 4 条 原则 如 下 。 

(1) 有 空 即 进 。 当 无 进程 处 于 临界 区 时 ， 人 允许 进程 进入 临界 区 ， 并 且 只 能 在 临界 区 运行 有 限 
的 时 间 。 

(2) 无 空 则 等 。 当 有 一 个 进程 在 临界 区 时 ， 其 他 欲 进入 临界 区 的 进程 必须 等 待 ， 以 保证 进 
程 互 斥 地 访问 临界 资源 。 


(3) 有 限 等 待 。 对 于 要 求 访问 临界 资源 的 进程 ， 应 保证 进程 能 在 有 限 的 时 间 进 入 临界 区 ， 
以 免 陷 入 “饥饿 ”状态 。 

(4) 让 权 等 待 。 当 进程 不 能 进入 自己 的 临界 区 时 ， 应 立即 释放 处 理 机 ， 以 免 进程 陷入 忙 等 
状态 。 


2. 信号 量 机制 


荷兰 学 者 Dijkstra 于 1965 年 提出 的 信号 量 机 制 是 一 种 有 效 的 进程 同步 与 互 斥 工具 。 目 前 
信号 量 机 制 有 了 很 大 的 发 展 ， 主 要 有 整 型 信号 量 、 记 录 型 信号 量 和 信号 量 集 机 制 。 

1) 整 型 信号 量 与 PV 操作 

信号 量 是 一 个 整 型 变量 ， 根 据 控制 对 象 的 不 同 被 赋予 不 同 的 值 。 信 号 量 分 为 如 下 两 类 : 

(1) 公用 信号 量 。 实 现 进 程 间 的 互 斥 ， 初 值 为 1 或 资源 的 数目 。 

(2) 私 用 信号 量 。 实 现 进程 间 的 同步 ， 初 值 为 0 或 某 个 正 整数 。 

信号 量 8 的 物理 意义 5 宇 0 表示 某 资源 的 可 用 数 ， 若 S<0， 则 其 绝对 值 表示 阻塞 队列 中 等 
待 该 资源 的 进程 数 。 

对 于 系统 中 的 每 个 进程 ， 其 工作 的 正确 与 否 不 仅 取决 于 它 自身 的 正确 性 ， 而 且 与 它 在 执行 
中 能 否 与 其 他 相关 进程 正确 地 实施 同步 互 扩 有 关 。PYV 操作 是 实现 进程 同步 与 互 斥 的 常用 方法 。 
P 操作 和 V 操作 是 低级 通信 原 语 ， 在 执行 期 间 不 可 分 割 。 其 中 ，P 操作 表示 申请 一 个 资源 ，V 
操作 表示 释放 一 个 资源 。 

P 操作 的 定义 : S:=S-1， 若 5S 宇 0， 则 执行 P 了 操作 的 进程 继续 执行 ， 若 S<0， 则 置 该 进程 为 
阻塞 状态 〈 因 为 无 可 用 资源 )， 并 将 其 插入 阻塞 队列 。 

P 操作 可 用 如 下 过 程 表 示 ， 其 中 ，Semaphore 表示 所 定义 的 变量 是 信号 量 。 
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Procedure P(Var S:Semaphore); 
Begin 
S:=S—1; 
If S<0 then W(S) {执行 了 操作 的 进程 插入 等 待 队列 } 
End; 


V 操作 定义 : S: =S+l， 若 S>0， 则 执行 V 操作 的 进程 继续 执行 ， 若 S<0， 则 从 阻塞 状态 


唤醒 一 个 进程 ， 并 将 其 插入 就 绪 队 列 ， 然 后 执行 V 操作 的 进程 继续 。 
V 操作 可 用 如 下 过 程 表示 。 


Procedure V(Var S:Semaphore); 
Begin 
S:=S+1; 
IfS<0 then R(S) {从 阻塞 队列 中 唤醒 一 个 进程 } 
End; 


2) 利用 PV 操作 实现 进程 的 互 斥 


令 信号 量 mutex 的 初 值 为 1， 当 进入 临界 区 时 执行 P 操 作 ， 退 出 临界 区 时 执行 V 操作 。 这 
样 ， 利 用 PV 操作 实现 进程 互 斥 的 代码 段 如 下 : 


P(mutex) 
临界 区 
V(mutex) 
【 例 4.1】 将 交通 流量 统计 程序 改写 如 下 。 
Pi P2 
L1: if 有 车 通过 then L2: begin 
begin P(mutex) 
P(mutex) PRINT COUNT; 
COUNT':=COUNT+1; COUNT:=0; 
V(mutex) V(mutex) 
end end 
GOTO L1; GOTO L2; 


3) 利用 PV 操作 实现 进程 的 同步 
进程 的 同步 是 由 于 进程 间 合 作 引 起 的 相互 制约 的 问题 , 要 实现 进程 的 同步 可 用 一 个 信号 量 
与 消息 联系 起 来 ， 当 信号 量 的 值 为 0 时 表示 希望 的 消息 未 产生 ， 当 信和 号 量 的 值 为 非 0 时 表示 希 
望 的 消息 已 经 存在 。 假 定 用 信号 量 S 表示 某 条 消息 ， 进 程 可 以 通过 调用 了 操作 测试 消息 是 否 到 
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达 ， 调 用 V 操作 通知 消息 已 准备 好 。 最 典型 的 同步 问题 是 单 缓冲 区 的 生产 者 和 消费 者 的 同步 问题 。 


【 例 4.2】 生产 者 进程 P, 不断 地 生产 产品 送 入 缓冲 区 ， 消 费 者 进程 P 不 断 地 从 缓冲 区 中 取 
产品 消费 。 请 给 出 实现 进程 同步 的 模型 图 。 


解 : 为 了 实现 P, 与 P 进程 间 的 同步 问题 ， 需 要 设置 两 个 信号 量 S, 和 %， 但 信号 量 初 值 不 


同 可 有 如 下 两 种 实现 方案 。 


方案 1: 信号 量 5 的 初 值 为 1， 表 示 缓 冲 


区 空 ， 可 以 将 产品 送 入 缓冲 区 ; 信号 量 5; 的 初 值 


为 0， 表示 缓冲 区 有 产品 。 其 同步 过 程 如 图 4-6 所 示 。 
方案 2: 信号 量 51 的 初 值 为 0， 信 号 量 5; 的 初 值 为 0， 此 时 同步 过 程 如 图 4-7 所 示 。 


Pp 


生产 一 个 产品 
P(S) 从 缓冲 区 取 一 个 产品 
产品 送 缓冲 区 VGD) 
V(S) 消费 
4 | 


图 4-6 单 缓冲 区 的 同步 举例 方法 1 
【 例 4.3】 一 个 生产 者 和 一 个 消费 者 ， 组 冲 


用 


P(S,) 


P, 


生产 一 个 产品 


P(S,) 

产品 送 缓冲 区 从 缓冲 区 取 一 个 产品 
V(S,) VC 
P(S) 消费 


| Ll 


图 4-7 单 缓冲 区 的 同步 举例 方法 2 


区 中 可 存放 nn 件 产品 ， 生 产 者 不 断 地 生产 产品 ， 


消费 者 不 断 地 消费 产品 ， 如 何 用 PV 操作 实现 生产 者 和 消费 者 的 同步 。 可 以 通过 设置 3 个 信号 
量 8%、S 和 品 ， 其中，8 是 一 个 互 斥 信号 量 ， 初 值 为 1， 因 为 缓冲 区 是 一 个 互 斥资 源 ， 所 以 需要 
进行 互 斥 控 制 ，5, 表示 是 否 可 以 将 产品 放 入 缓冲 区 ， 初 值 为 nx，5, 表示 缓冲 区 是 否 存 有 产品 ， 


初 值 为 0。 其 同步 过 程 如 图 4-8 所 示 。 


Pi 


P(S) 
P(S) 


V(S) 
VC?) 


[| 


图 4-8 了 个 缓冲 


生产 个 产品 


产品 送 缓冲 区 


P(S) 
P(S) 
从 缓冲 区 取 一 个 产品 
VG) 
V(S) 
消费 


| 


区 的 同步 举例 
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3. 高 级 通信 和 原 语 


进程 间 通信 是 指 进程 之 间 的 信息 交换 ， 少 则 一 个 信息 ， 多 则 成 千 上 万 个 信息 。 根 据 交 换 信 
息 量 的 多 少 和 效率 的 高 低 , 进程 通信 的 方式 分 为 低级 方式 和 高 级 方式 。PV 操 作 属 于 低级 通信 方 
式 ， 若 用 PV 操作 实现 进程 间 通 信 ， 则 存在 如 下 问题 。 

(1) 编程 难度 大 ， 通 信 对 用 户 不 透明 ， 即 要 用 户 利用 低级 通信 工具 实现 进程 间 的 同步 与 互 
斥 。 而 且 ，PV 操作 使 用 不 当 容 易 引起 死 锁 。 

(2) 效率 低 ， 生 产 者 每 次 只 能 向 缓冲 区 放 一 个 消息 ， 消 费 者 只 能 从 缓冲 区 取 一 个 消息 。 

为 了 提高 信号 通信 的 效率 ， 传 递 大 量 数据 ， 减 轻 程 序 编制 的 复杂 度 ， 系 统 引 入 了 高 级 通信 
方式 。 高 级 通信 方式 主要 分 为 共享 存储 模式 、 消 息 传递 模式 和 管道 通信 。 

(1) 共享 存储 模式 。 相互 通信 的 进程 共享 某 些 数据 结构 (或 存储 区 ) 实现 进程 之 间 的 通信 。 

(2) 消息 传递 模式 。 进 程 间 的 数据 交换 以 消息 为 单位 ， 程 序 员 直接 利用 系统 提供 的 一 组 通 
信 命 令 〈 原 语 ) 来 实现 通信 ， 如 Send(A)、Receive(A)。 

(3) 管道 通信 。 所 谓 管道 ， 是 指 用 于 连接 一 个 读 进 程 和 一 个 写 进程 ， 以 实现 它们 之 间 通 信 
的 共享 文件 (pipe 文件 )。 向 管道 《共享 文件 ) 提供 输入 的 发 送 进程 ( 即 写 进程 ;， 以 字符 流 的 
形式 将 大 量 的 数据 送 入 管道 ; 而 接收 进程 可 从 管道 接收 大 量 的 数据 。 由 于 它们 通信 时 采用 管道 ， 
所 以 称 为 管道 通信 。 


4.2.4 管 程 
1， 管 程 的 引入 


若 用 信号 量 和 P、V 操作 来 解决 进程 的 同步 与 互 斥 问 题 ， 需 要 在 程序 中 的 适当 位 置 安排 P、 
V 操作 ， 否 则 会 造成 死 锁 错误 。 为 了 解决 分 散 编程 带 来 的 困难 ，1974 年 和 1975 年 汉 森 (Brinsh 
Hansen) 和 霍 尔 (Hoare) 提出 了 另 一 种 同步 机 制 一 一 管 程 (Monitor)。 其 基本 思路 是 采用 资源 
集中 管理 的 方法 ， 将 系统 中 的 资源 用 某 种 数据 结构 抽象 地 表示 出 来 。 由 于 临界 区 是 访问 共享 资 
源 的 代码 段 ， 建 立 一 个 管 程 管理 进程 提出 的 访问 请 求 。 

采用 这 种 方式 对 共享 资源 的 管理 就 可 以 借助 数据 结构 及 在 其 上 实施 操作 的 若干 过 程 来 进 
行 ， 对 共享 资源 的 申请 和 释放 可 以 通过 过 程 在 数据 结构 上 的 操作 来 实现 。 

管 程 由 一 些 共享 数据 、 一 组 能 为 并 发 进程 所 执行 的 作用 在 共享 数据 上 的 操作 的 集合 、 初 始 
代码 以 及 存 取 权 组 成 。 管 程 提 供 了 一 种 可 以 允许 多 进程 安全 、 有 效 地 共享 抽象 数据 类 型 的 机 制 ， 
管 程 实现 同步 机 制 由 “条 件 结构 〈Condition Construct)” 所 提供 。 为 实现 进程 互 斥 同步 ， 必 须 
定义 一 些 条 件 变量 , 例如 var notempty、notfull: condition, 这 些 条 件 变量 只 能 被 wait 和 signal 操 
作 所 访问 。notfull.wait 操作 意味 着 调用 该 操作 的 进程 将 被 挂 起 ， 使 另 一 个 进程 执行 ， 而 
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notfull.signal 操作 仅仅 是 启动 一 个 被 挂 起 的 进程 ,如 无 挂 起 进程 ， 则 notfull.signal 操作 相当 于 


操作 ， 不 改变 notfull 状态 ， 这 不 同 于 V 操作 。 
2. 管 程 的 结构 
每 一 个 管 程 都 要 有 一 个 名 字 以 供 标识 ， 用 语言 来 写 一 个 管 程 的 形式 如 下 : 


Type < 管 程 名 >=monitor 
< 管 程 变量 说 明 >; 
define < (能 被 其 他 模块 引用 的 ) 过 程 名 列表 >; 
procedure ”< 过 程 名 > (< 形式 参数 表 >) 
begin 
< 过 程 体 >; 


end; 


pad < 过 程 名 > (< 形式 参数 表 >) 
begin 
< 过 程 体 >; 


end; 


begin 
< 管 程 的 局 部 数据 初始 化 语句 >; 


end. 


3. 利用 管 程 解决 生产 者 一 消费 者 问题 


局 


【 例 4.4】 建立 一 个 管 程 Producer-Consumer， 它 包括 两 个 过 程 put (item) 和 get (item)， 
分 别 执行 将 生产 的 消息 放 入 缓冲 池 和 从 缓冲 池 取 出 消息 的 操作 ， 设 置 变量 count 表示 缓冲 池 已 


存 消息 的 数目 。 管 程 描述 如 下 : 


Type Producer-Consumer=monitor 
var buffer : array [ 0, .… ,n-1] of item ; {定义 缓冲 区 } 


in , out , count : integer ; {in out 为 存 取 指 针 , count 为 缓冲 区 产品 个 数 } 
notfull ,notempty :condition ; { 条 件 变量 } 
procedure entry put (item) 
begin 
if count>=n then notfull.wait; {缓冲 区 已 满 } 


buffer (in ) := nextp ; 
in:=(intl) modn; 


count=count+1; 
ifnotempty.queue ”then notempty.signal ; {唤醒 等 待 者 } 
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end 


procedure entry get (item) 
begin 
if count <= 0then notempty.wait; {缓冲 区 已 空 } 
nextc := buffer (out ) ; 
out := (out+1) modn ; 
count := count - 1 ; { 减 少 一 个 产品 } 
过 ”notfull.queue then notfull.signal; 。 {唤醒 等 待 者 } 
end 
begin in:=out:=0; count:=0; end {初始 化 } 


利用 管 程 解决 生产 者 一 消费 者 问题 ， 其 中 生产 者 和 消费 者 程序 如 下 : 


cobegin 
producer : begin 
repeat 
producean item innextp; 
Producer-Consumer.put (item) ; 
until false; 
end 
consumer : begin 
repeat 
Producer-Consumer.get (item) ; 
consume the item in nextc ; 
until false ; 
end; 


coend 


4.2.5 ”进程 调度 


进程 调度 方式 是 指 当 有 更 高 优先 级 的 进程 到 来 时 如 何 分 配 CPU。 调度 方式 分 为 可 剥夺 和 不 
可 和 剥夺 两 种 。 可 剥夺 式 是 指 当 有 更 高 优先 级 的 进程 到 来 时 ,强行 将 正在 运行 进程 的 CPU 分 配给 
高 优先 级 的 进程 ;不 可 剥夺 式 是 指 当 有 更 高 优先 级 的 进程 到 来 时 ， 必 须 等 待 正 在 运行 进程 自动 


释放 占用 的 CPU， 然 后 将 CPU 分 配给 高 优先 级 的 进程 。 
1. 三 级 调度 


在 某 些 操作 系统 中 ， 一 个 作业 从 提交 到 完成 需要 经 历 高 、 中 、 低 三 级 调度 。 
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(1) 高 级 调度 。 高 级 调度 又 称 “ 长 调度 ”“ 作 业 调 度 ”或 “接纳 调度 ”， 它 决定 处 于 输入 池 
中 的 哪个 后 备 作业 可 以 调 入 主 系统 做 好 运行 的 准备 ， 成 为 一 个 或 一 组 就 绪 进程 。 在 系统 中 一 个 
作业 只 需 经 过 一 次 高 级 调度 。 
(2) 中 级 调度 。 中 级 调度 又 称 “ 中 程 调度 ”或 “对 换 调度 ”， 它 决定 处 于 交换 区 中 的 哪个 
就 绪 进程 可 以 调 入 内 存 ， 以 便 直接 参与 对 CPU 的 竞争 。 在 内 存 资源 紧张 时 , 为 了 将 进程 调 入 内 
存 ， 必 须 将 内 存 中 处 于 阻塞 状态 的 进程 调 出 至 交换 区 ， 以 便 为 调 入 进程 腾 出 空间 。 这 相当 于 使 
处 于 内 存 的 进程 和 处 于 盘 交 换 区 的 进程 交换 了 位 置 。 

(3) 低级 调度 。 低 级 调度 又 称 “短程 调度 ”或 “进程 调度 ”， 它 决定 处 于 内 存 中 的 哪个 就 
绪 进程 可 以 占用 CPU。 低级 调度 是 操作 系统 中 最 活跃 、 最 重要 的 调度 程序 , 对 系统 的 影响 很 大 。 


2. 调度 算法 


常用 的 进程 调度 算法 有 先 来 先 服务 、 时 间 片 轮转 、 优 先 级 调度 和 多 级 反馈 调度 算法 。 

(1) 先 来 先 服务 (FCFS)。FCFS 按照 作业 提交 或 进程 成 为 就 绪 状 态 的 先后 次 序 分 配 CPU， 
即 进程 调度 总 是 将 就 绪 队 列队 首 的 进程 投入 运行 。FCFS 的 特点 是 比较 有 利于 长 作业 ， 而 不 利于 
短 作业 ， 有 利于 CPU 繁忙 的 作业 ， 而 不 利于 IO 繁忙 的 作业 。FCFS 算法 主要 用 于 宏观 调度 。 

(2) 时 间 片 轮转 。 时 间 片 轮转 算法 主要 用 于 微观 调度 ， 其 设计 目标 是 提高 资源 利用 率 。 通 
过 时 间 片 轮转 提高 进程 并 发 性 和 响应 时 间 特 性 ， 从 而 提高 资源 利用 率 。 时 间 片 的 长 度 可 以 从 几 毫 
秒 到 几 百 毫秒 ， 选 择 的 方法 一 般 有 如 下 两 种 。 

@ 固定 时 间 片 。 分 配给 每 个 进程 相等 的 时 间 片 ， 使 所 有 进程 都 公平 执行 ， 它 是 一 种 实现 
简单 且 有 效 的 方法 。 

@ 可 变 时 间 片 。 根 据 进程 不 同 的 要 求 对 时 间 片 的 大 小 实时 修改 ， 可 以 更 好 地 提高 效率 。 

(3) 优先 级 调度 。 优 先 级 调度 算法 是 让 每 一 个 进程 都 拥有 一 个 优先 数 ， 数 值 大 的 表示 优先 
级 高 ， 系 统 在 调度 时 总 选择 优先 数 大 的 占用 CPU。 优 先 级 调度 分 为 静态 优先 级 和 动态 优先 级 
两 种 。 

@ 静态 优先 级 。 进 程 的 优先 级 在 创建 时 确定 ， 直 到 进程 终止 都 不 会 改变 。 通 常 根 据 以 下 
因素 确定 优先 级 : 进程 类 型 〈 如 系统 进程 优先 级 较 高 )、 对 资源 的 需求 (如 对 CPU 和 内 存 需求 
较 少 的 进程 优先 级 较 高 )、 用 户 要 求 〈 如 紧迫 程度 和 付费 多 少 )。 

@ 动态 优先 级 。 在 创建 进程 时 赋予 一 个 优先 级 ， 在 进程 运行 过 程 中 还 可 以 改变 ， 以 便 获 
得 更 好 的 调度 性 能 。 例 如 ， 在 就 绪 队列 中 ， 随 着 等 待 时 间 增 长 ， 优 先 级 将 提高 。 这 样 ， 对 于 优 
先 级 较 低 的 进程 在 等 待 足够 的 时 间 后 , 其 优先 级 提高 到 可 被 调度 执行 。 进程 每 执行 一 个 时 间 片 ， 
就 降低 其 优先 级 ， 从 而 当 一 个 进程 持续 执行 时 ， 其 优先 级 会 降低 到 让 出 CPU。 

(4) 多 级 反馈 调度 。 多 级 反馈 队列 调度 算法 如 图 4-9 所 示 ， 该 算法 是 时 间 片 轮转 算法 和 优 
先 级 算法 的 综合 与 发 展 。 其 优点 有 三 个 方面 : 第 一 ， 照 顾 了 短 进程 以 提高 系统 吞吐 量 、 缩 短 了 
平均 周转 时 间 ; 第 二 ， 照 顾 IO 型 进程 以 获得 较 好 的 IO 设备 利用 率 和 缩短 响应 时 间 ， 第 三 ， 
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不 必 估计 进程 的 执行 时 间 ， 动 态 调节 优先 级 。 


降低 优先 级 
最 高 优先 级 队列 
进 运行 结束 
次 高 优先 级 队列 撤销 进程 
入 ; 
低 优先 级 队列 ”| 
就 结 进 程 
图 4-9 多 级 反馈 队列 调度 算法 
多 级 反馈 队列 调度 算法 实现 思路 如 下 。 


@ 设置 多 个 就 绪 队 列 。 队 列 1， 队 列 2，…， 队 列 分别 赋予 不 同 的 优先 级 ， 队 列 1 的 优 
先 级 过 队列 2 的 优先 级 宇 … 宇 队列 n 的 优先 级 。 每 个 队列 执行 时 间 片 的 长 度 也 不 同 ， 规 定 优先 
级 越 低 时 间 片 越 长 ， 如 逐 级 加 倍 。 

@ 新 进程 进入 内 存 后 ， 先 投入 队列 1 的 末尾 ， 按 FCFS 算法 调度 ， 若 某 进 程 在 队列 1 的 
一 个 时 间 片 内 未 能 执行 完 ， 则 降低 投入 到 队列 2 的 末尾 ， 同 样 按 FCFS 算法 调度 ， 如 此 下 去 ， 
当 进 程 降低 到 最 后 的 队列 时 ， 则 按 “ 时 间 片 轮转 ”算法 调度 直到 完成 。 

@ 仅 当 较 高 优先 级 的 队列 为 空 才 调度 较 低 优先 级 队列 中 的 进程 执行 。 如 果 进 程 执行 时 有 
新 进程 进入 较 高 优先 级 的 队列 ， 则 抢先 执行 新 进程 ， 并 把 被 抢先 的 进程 投入 原 队 列 的 末尾 。 


3. 进程 优先 级 确定 


优先 级 确定 需要 考虑 如 下 情况 。 
(1) 对 于 IO 型 进程 ， 让 其 进入 最 高 优先 级 队列 ， 以 及 时 响应 需要 IO 交互 的 进程 。 通 常 
执行 一 个 小 的 时 间 片 , 在 该 时 间 片 内 要 求 可 处 理 完 一 次 IO 请 求 的 数据 , 然后 转 入 到 阻塞 队列 。 
(2) 对 于 计算 型 进程 ， 每 次 都 执行 完 时 间 片 后 进入 更 低级 队列 。 最 终 采 用 最 大 时 间 片 来 执 
行 ， 以 减少 调度 次 数 。 
(3) 对 于 IO 次 数 不 多 ， 主 要 是 CPU 处 理 的 进程 ， 在 IO 完成 后 ， 返 回 优先 IO 请 求 时 离 
的 队列 ， 以 免 每 次 都 回 到 最 高 优先 级 队列 后 再 逐次 下 降 。 
(4) 为 适应 一 个 进程 在 不 同时 间 段 的 运行 特点 ，LIO 完成 时 ， 提 高 优先 级 ; 时间 片 用 完 时 ， 
降低 优先 级 。 


4.2.6 ” 死 锁 
在 计算 机 系统 中 有 许多 互 斥资 源 〈 如 磁带 机 、 打 印 机 和 绘图 仪 等 ) 或 软件 资源 (如 进程 表 、 
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临界 区 等 )， 若 两 个 进程 同时 使 用 打印 机 ， 或 同时 进入 临界 区 必然 会 出 现 问题 。 所 谓 死 锁 ， 是 
指 两 个 以 上 的 进程 互相 都 要 求 对 方 已 经 占有 的 资源 导致 无 法 继续 运行 下 去 的 现象 。 


1. 死 锁 举例 


【 例 4.5】 进程 推进 顺序 不 当 引起 的 死 锁 。 设 系统 中 有 一 台 读 卡 机 A， 一 台 打印 机 B， 它 
们 被 进程 P 和 书 共 享 ， 两 个 进程 并 发 执行 ， 它 们 按 下 列 顺序 请 求 和 释放 资源 。 


已 P, 
Request(A); <a> Request(B); <a> 
Request(B); <b> Request(A); <b> 
Release(B); Release(A); 
Release(A); Release(B); 
假如 按 Pl<a> P<a> Pi<b> P<b> 的 次 序 执行 ， 则 系统 会 发 生死 锁 。 因 为 进程 P<a> 时 ， 由 


于 读 卡 机 未 被 占用 ， 所 以 请 求 可 以 得 到 满足 ， 进 程 P<a> 时 ， 由 于 打印 机 未 被 占用 ， 所 以 请 求 
也 可 以 得 到 满足 。 接 着 进程 P.<b> 时 ， 由 于 打印 机 被 占用 ， 所 以 请 求 得 不 到 满足 ，P 等 待 ， 进 
程 P<b> 时 ， 由 于 读 卡 机 被 占用 ， 所 以 请 求 得 不 到 满足 ，P, 也 等 待 ， 导 致 互相 在 请 求 对 方 已 占 
有 的 资源 ， 系 统 发 生死 锁 。 
【 例 4.6】 同类 资源 分 配 不 当 引起 死 锁 。 若 系统 中 有 m 个 资源 被 n 个 进程 共享 ， 当 每 个 进 
程 都 要 求 上 个 资源 ， 而 m<nk 时 ， 即 资源 数 小 于 进程 所 要 求 的 总 数 时 ， 可 能 会 引起 死 锁 。 例 如 ， 
m=5，n=3， 本 3， 若 系统 采用 的 分 配 策略 是 轮流 地 为 每 个 进程 分 配 ， 则 第 一 轮 系统 先 为 每 个 进 
程 分 配 一 台 ， 还 剩 下 两 台 ， 第 二 轮 系统 再 为 两 个 进程 各 分 配 一 台 ， 此 时 ， 系 统 中 已 无 可 供 分 配 
的 资源 ， 使 得 各 个 进程 都 处 于 等 待 状态 导致 系统 发 生死 锁 。 
【 例 4.7】 PV 操作 使 用 不 当 引 起 的 死 锁 。 对 于 图 4-10， 当 信和 号 量 5.=52=0 时 将 发 生死 锁 。 


Pp 户 
生产 一 个 产品 P(S») 
产品 送 缓冲 区 从 缓冲 区 取 一 个 产品 
P(S') V(S) 
V(S;) 消费 


图 4-10 PV 操作 引起 的 死 锁 
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从 图 4-10 可 知 ，P, 进程 从 缓冲 区 取 产 品 前 ， 先 执行 PS)， 由 于 Ss= -1， 故 P, 等待，PI 
进程 将 产品 送 到 缓冲 区 后 ， 执 行 P($1)， 由 于 S= -1， 故 Pi 等 待 。 这 样 ，P!、P, 进 程 都 无 法 继 
续 运 行 下 去 ， 导 致 系统 死 锁 。 


2.， 死 锁 产生 的 原因 及 4 个 必要 条 件 


从 上 述 例题 分 析 可 以 看 出 ， 产 生死 锁 的 原因 为 竞争 资源 及 进程 推进 顺序 非法 。 当 系统 中 有 
多 个 进程 所 共享 的 资源 不 足以 同时 满足 它们 的 需求 时 ， 将 引起 它们 对 资源 的 竞争 导致 死 锁 。 进 
程 推进 顺序 非法 ， 指 进程 在 运行 的 过 程 中 请 求 和 释放 资源 的 

顺序 不 当 ， 导 致 进程 死 锁 。 产 生死 锁 的 4 个 必要 条 件 是 互 斥 (») 

条 件 、 请 求 保持 条 件 、 不 可 弹 夺 条 件 和 环 路 条 件 。 


当 发 生死 锁 时 ， 


在 进程 资源 有 向 图 中 必 构 成 环 路 , 其 中 R [ol]a: 


oo 


每 个 进程 占有 了 下 一 个 进程 申请 的 一 个 或 多 个 资源 ， 如 图 


4-11 所 示 。 


进程 资源 有 向 图 由 方 框 、 圆 图 和 有 向 边 三 部 分 组 成 。 其 
中 方 框 表示 资源 ， 圆 圈 表 示 进 程 。 请 求 资源 : O 一 口 ， 箭 头 图 4-11 进程 资源 有 向 图 
进程 指向 资源 ; 分 配 资源 : O 〇 一口, 箭头 由 资源 指向 进程 。 


3. 死 锁 的 处 理 


死 锁 的 处 理 策略 主要 有 4 种 ， 驶 鸟 策略 ( 即 不 理 上 坚 策 略 )、 预 防 策略 、 避 免 策 略 和 检测 与 


解除 死 锁 。 
1) 死 锁 预防 


死 锁 预防 是 采用 某 种 策略 限制 并 发 进程 对 资源 的 请 求 ,破坏 死 锁 产生 的 4 个 必要 条 件 之 一 ， 
使 系统 在 任何 时 刻 都 不 满足 死 锁 的 必要 条 件 。 预 防 死 锁 的 两 种 策略 如 下 。 

(1) 预先 静态 分 配 法 。 破 坏 了 “不 可 剥夺 条 件 ” 预先 分 配 所 需 资 源 ， 保 证 不 等 待 资源 。 
该 方法 的 问题 是 降低 了 对 资源 的 利用 率 ， 降 低 进程 的 并 发 程度 ， 有 时 可 能 无 法 预先 知道 所 需 


(2) 资源 有 序 分 配 法 。 破 坏 了 “ 环 路 条 件 ”， 把 资源 分 类 按 顺 序 排列 ， 保 证 不 形成 环 路 。 
该 方法 存在 的 问题 是 限制 进程 对 资源 的 请 求 ， 由 于 资源 的 排序 占用 系统 开销 。 


2) 死 锁 避免 


死 锁 预防 是 设法 破坏 产生 死 锁 的 4 个 必要 条 件 之 一 ， 严 格 防止 死 锁 的 产生 。 死 锁 避 免 则 不 


那么 严格 地 限制 产 4 


死 锁 的 必要 条 件 。 最 著名 的 死 锁 避免 算法 是 Dijkstra 提出 的 银行 家 算法 ， 


死 锁 避免 算法 需要 很 大 的 系统 开销 。 
银行 家 算法 对 于 进程 发 出 的 每 一 个 系统 可 以 满足 的 资源 请 求 命令 加 以 检测 ， 如果 发 现 分 配 
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资源 后 系统 进入 不 安全 状态 ， 则 不 予 分 配 ; 车 分 配 资源 后 系统 仍 处 于 安全 状态 ， 则 实施 分 配 。 
与 死 锁 预防 策略 相 比 ， 它 提高 了 资源 的 利用 率 ， 但 检测 分 配 资源 后 系统 是 否 安全 增加 了 系统 开销 。 

所 谓 安全 状态 ， 是 指 系统 能 按 某 种 顺序 如 < 太 , 已 ,…, 忆 > 来 为 每 个 进程 分 配 其 所 需 资源 ， 
直到 最 大 需求 ， 使 每 个 进程 都 可 顺序 完成 。 通 常 称 < 玉 , 已 ,…, 已 > 序列 为 安全 序列 。 若 系统 不 
存在 这 样 一 个 安全 序列 ， 则 称 系统 处 于 不 安全 状态 。 

【 例 4.8】 假设 系统 中 有 三 类 互 斥资 源 RI、R, 和 Rs， 可 用 资源 数 分 别 为 8、7 和 4。 在 也 
时 刻 系统 中 有 Pi, P, P;, Py 和 Ps 这 5 个 进程 ， 这 些 进程 对 资源 的 最 大 需求 量 和 已 分 配 资源 数 如 
图 4-12 所 示 。 


已 分 配 资源 数 
RI 


图 4-12 进程 已 分 配 资源 数 


车 有 如 下 4 个 执行 序列 ， 那 么 进程 按 什么 序列 执行 ， 系 统 状 态 是 安全 的 。 

© 书 一 P 一 Pi 一 P 一 户 @ 忆 一 P 一 Pi 一 Pi 一 记 

@ P 忆 一 P 一 已 一 P 一 P @ Pi 一 P 一 Pi 一 PP 一 瑚 

解 : 初始 时 系统 的 可 用 资源 数 分 别 为 8、7 和 4, 在 To 时 刻 已 分 配 资源 数 分 别 为 7、6 和 4， 
因此 系统 剩余 的 可 用 资源 数 分 别 为 1、1 和 0。 

由 于 Rs 资源 为 0， 系 统 不 能 再 分 配 及 资源 了 ， 所 以 不 能 一 开始 就 运行 需要 分 配 及 资源 的 
进程 己 和 己 ， 故 D 和 @ 显 然 是 不 安全 的 。 

分 析 序列 @ 的 Py 一 P 一 PPs 一 P; 是 否 安 全 。 进 程 Py 可 以 设置 能 完成 标志 True, 如 图 4-13 


R RR; 成 标志 
2 3 1 True 
| » | :231 0 1 1 2 1 1 4 4 2 me | 
[mm | +442 5 3 1 Eh | 


4-13 ”进程 按 序列 @ 的 PP,P1 一 Ps 一 *P; 执 行 
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因为 系统 的 可 用 资源 数 为 1，1，0)， 而 进程 Py 只 需要 一 台 Ri 资源。 进程 P, 可 以 设置 能 
完成 标志 True， 因为 进程 Py 运行 完毕 将 释放 所 有 资源 ,此 时 系统 的 可 用 资源 数 应 为 (2, 3, 1)， 
而 进程 P, 只 需要 (0，1，1)， 进 程 P, 运 行 完 毕 将 释放 所 有 资源 ， 此 时 系统 的 可 用 资源 数 应 为 
(4，4，2)。 进 程 Pi 不 能 设置 能 完成 标志 True， 因 为 进程 P 需要 Ri 资源 为 5， 系统 能 提供 的 
玉 资源 为 4， 所 以 序列 @@ 无 法 进行 下 去 ， 因 此 ， 忆 一 P 一 书 一 P; 一 PP 为 不 安全 序列 。 

序列 四 的 已 一 忆 一 P; 一 已 一 忆 是 安全 的 ， 因 为 所 有 的 进程 都 能 设置 完成 标志 True， 如 图 
4-14 所 示 。 


图 4-14 ”进程 按 序列 @ 的 PP 一 P 一 Ps: 一 Pi 一 P; 执 行 


3) 死 锁 检测 

解决 死 锁 的 另 一 条 途径 是 使 用 死 锁 检测 方法 ,这 种 方法 对 资源 的 分 配 不 加 限制 , 即 允 许 死 锁 
产生 。 但 系统 定时 地 运行 一 个 死 锁 检测 程序 ， 判 断 系统 是 否 发 生死 锁 ， 若 检测 到 有 死 锁 ， 则 设法 
加 以 解除 。 

4) 死 锁 解除 

死 锁 解除 通常 采用 如 下 方法 。 

(1) 资源 剥夺 法 。 从 一 些 进 程 那里 强行 剥夺 足够 数量 的 资源 分 配给 死 锁 进程 。 

(2) 撤销 进程 法 。 根 据 某 种 策略 逐个 地 撤销 死 锁 进程 ， 直 到 解除 死 锁 为 止 。 


4.2.7 ”线程 


传统 的 进程 有 两 个 基本 属性 : 可 拥有 资源 的 独立 单位 ， 可 独立 调度 和 分 配 的 基本 单位 。 引 
入 线程 的 原因 是 进程 在 创建 、 撤 销 和 切换 中 ， 系 统 必须 为 之 付出 较 大 的 时 空 开销 ， 故 在 系统 中 
设置 的 进程 数目 不 宜 过 多 ， 进 程 切换 的 频率 不 宜 太 高 ， 这 就 限制 了 并 发 程度 的 提高 。 引 入 线程 
后 ， 将 传统 进程 的 两 个 基本 属性 分 开 ， 线 程 作为 调度 和 分 配 的 基本 单位 ， 进 程 作为 独立 分 配 资 
源 的 单位 。 用 户 可 以 通过 创建 线程 来 完成 任务 ， 以 减少 程序 并 发 执行 时 付出 的 时 空 开销 。 

例如 ， 在 文件 服务 进程 中 可 设置 多 个 服务 线程 ， 当 一 个 线程 受阻 时 ， 第 二 个 线程 可 以 继续 
运行 ， 当 第 二 个 线程 受阻 时 ， 第 三 个 线程 可 以 继续 运行 …… 从 而 显著 地 提高 了 文件 系统 的 服务 
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质量 及 系统 的 吞吐 量 。 

这 样 ， 对 于 拥有 资源 的 基本 单位 ， 不 用 频繁 的 切换 ， 进 一 步 提高 了 系统 中 各 程序 的 并 发 程 
度 。 需 要 说 明 的 是 ， 线 程 是 进程 中 的 一 个 实体 ， 是 被 系统 独立 分 配 和 调度 的 基本 单位 。 线 程 基 
本 上 不 拥有 资源 ， 只 拥有 一 点 运行 中 必 不 可 少 的 资源 (如 程序 计数 器 、 一 组 寄存 器 和 栈 )， 它 
可 与 同属 一 个 进程 的 其 他 线程 共享 进程 所 拥有 的 全 部 资源 。 

线程 也 具有 就 绪 、 运 行 和 阻塞 3 种 基本 状态 。 由 于 线程 具有 许多 传统 进程 所 具有 的 特性 ， 
故 称 为 “轻型 进程 (Light-Weight Process )” 传统 进程 称 为 “重型 进程 〈Heavy-Weight 
了 Process)”。 线 程 可 创建 另 一 个 线程 ， 同 一 个 进程 中 的 多 个 线程 可 并 发 执行 。 

线程 分 为 用 户 级 线程 (User-Level Threads) 和 内 核 支持 线程 (Kernel-Supported Threads) 
两 类 。 用 户 级 线程 不 依赖 于 内 核 ， 该 类 线程 的 创建 、 撤 销 和 切换 都 不 利用 系统 调用 来 实现 ; 内 
核 支持 线程 依赖 于 内 核 ， 即 无 论 是 在 用 户 进程 中 的 线程 ， 还 是 在 系统 中 的 线程 ， 它 们 的 创建 、 
撤销 和 切换 都 利用 系统 调用 来 实现 。 某 些 系 统 同 时 实现 了 两 种 类 型 的 线程 。 

与 线程 不 同 的 是 ， 不 论 是 系统 进程 还 是 用 户 进程 ， 在 进行 切换 时 ， 都 要 依赖 于 内 核 中 的 进 
程 调度 。 因 此 ， 不 论 是 什么 进程 都 是 与 内 核 有 关 的 ， 是 在 内 核 支 持 下 进行 切换 的 。 尽 管线 程 和 
进程 表面 上 看 起 来 相似 ， 但 它们 在 本 质 上 是 不 同 的 。 


4.3 ”存储 管理 


存储 器 管理 的 对 象 是 主 存 存储 器 简称 主 存 或 内 存 。 存 储 器 是 计算 机 系统 中 的 关键 性 资源 ， 
是 存放 各 种 信息 的 主要 场所 。 尽 管 近年 来 内 存 越 来 越 便宜 、 容 量 越 来 越 大 ， 但 系统 软件 、 应 用 
软件 在 功能 及 其 所 需 存储 空间 等 方面 都 在 急剧 膨胀 ， 如 何 对 存储 器 实施 有 效 的 管理 ， 不 仅 直接 
影响 到 存储 器 的 利用 率 ， 而 且 还 对 系统 性 能 有 很 大 的 影响 。 存 储 器 管理 的 主要 功能 包括 主 存 空 
间 的 分 配 和 回收 、 提 高 主 存 的 利用 率 、 扩 充 主 存 、 对 主 存 信息 实现 有 效 保护 。 


4.3.1 基本 概念 
1， 存 储 器 的 结构 


存储 组 织 的 功能 是 在 存储 技术 和 CPU 寻 址 技 
术 许 可 的 范围 内 组 织 合 理 的 存储 结构 ， 使 得 各 层次 二 本 CR) 
的 存储 器 都 处 于 均衡 的 繁忙 状态 。 常 用 的 存储 器 的 | 主 存 (PrimaryStorage) 
结构 有 “寄存 器 一 主 存 一 外 存 ” 结 构 和 “寄存 器 一 | 外 存 (Secondary Storage) 
缓存 一 主 存 一 存储 组 织 的 功能 外 存 ” 结 构 ,如 图 4-15 
所 示 。 


寄存 器 (Register) 
一 


图 4-15 存储 器 的 层次 结构 
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(1) 虚拟 地 址 。 对 于 程序 员 来 说 ， 数 据 的 存放 地 址 是 由 符号 决定 的 ， 故 称 符号 名 地 址 ， 或 
者 称 为 名 地 址 ， 而 把 源 程 序 的 地 址 空间 称 为 符号 名 地 址 空间 或 者 名 空间 。 它 是 从 0 号 单元 开始 
编 址 ， 并 顺序 分 配 所 有 的 符号 名 所 对 应 的 地 址 单元 ， 毛 以 它 不 是 主 存 中 的 真实 地 址 ， 故 称 为 相 
对 地 址 、 程 序 地 址 、 风 辑 地 址 或 虚拟 地 址 。 

(2) 地 址 空间 。 把 程序 中 由 符号 名 组 成 的 空间 称 为 名 空间 。 源 程序 经 过 汇编 或 编译 后 再 经 
过 链接 编辑 程序 加 工 形成 程序 的 装配 模块 ， 即 转换 为 相对 地 址 编 址 的 模块 ， 它 是 以 0 为 基 址 顺 
序 进行 编 址 的 。 相 对 地 址 也 称 为 逻辑 地 址 或 虚 地 址 ， 把 程序 中 由 相对 地 址 组 成 的 空间 称 为 逻辑 
地 址 空间 。 相 对 地 址 空间 通过 地 址 再 定位 机 构 转换 到 绝对 地 址 空间 ， 绝 对 地 址 空间 也 称 为 物理 
地 址 空间 。 

(3) 存储 空间 。 简 单 来 说 ， 罗 辑 地 址 空间 〈 简 称 地 址 空间 ) 是 逻辑 地 址 的 集合 ， 物 理 地 址 
空间 《〈 简 称 存储 空间 ) 是 物理 地 址 的 集合 。 


2， 地址 重 定位 


地 址 重 定位 是 指 将 逻辑 地 址 变换 成 主 存 物理 地 址 的 过 程 。 在 可 执行 文件 装 入 时 ， 需 要 解决 
可 执行 文件 中 地 址 (指令 和 数据 ) 与 主 存 地 址 的 对 应 关系 ， 由 操作 系统 中 的 装 入 程序 Loader 和 
地 址 重 定位 机 构 来 完成 。 地 址 重 定位 分 为 静态 地 址 重 定位 和 动态 地 址 重 定位 。 

(1) 静态 重 定位 。 静 态 重 定位 是 指 在 程序 装 入 主 存 时 已 经 完成 了 逻辑 地 址 到 物理 地 址 的 变 
换 ， 在 程序 的 执行 期 间 将 不 会 再 发 生变 化 。 静 态 地 址 重 定位 的 优点 是 无 须 硬件 地 址 变换 机 构 的 
支持 ， 它 只 要 求 程序 本 身 是 可 重 定位 的 ， 只 对 那些 要 修改 的 地 址 部 分 具有 某 种 标识 ， 由 专门 设 
计 的 程序 来 完成 。 在 早期 的 操作 系统 中 大 多 采用 这 种 方法 。 静 态 重 定位 的 缺点 是 必须 给 作业 分 
配 一 个 连续 的 存储 区 域 ， 在 作业 的 执行 期 间 不 能 扩充 存储 空间 ， 也 不 能 在 主 存 中 移动 ， 多 个 作 
业 也 难以 共享 主 存 中 的 同一 程序 副本 和 数据 。 

(2) 动态 重 定位 。 动 态 重 定位 是 指 在 程序 运行 期 间 完 成 逻辑 地 址 到 物理 地 址 的 变换 。 其 实 
现 机 制 要 依赖 硬件 地 址 变换 机 构 ， 如 基地 址 寄存 器 (BR)。 动 态 地 址 重 定位 的 优点 是 程序 在 执 
行 期 间 可 以 转 入 和 转 出 主 存 ， 以 解决 主 存 空间 不 足 的 问题 ， 可 以 在 主 存 中 移动 ， 把 主 存 中 的 碎 
片 集中 起 来 ， 以 充分 利用 空间 ; 不必 给 程序 分 配 连续 的 主 存 空间 ， 可 以 较 好 地 利用 较 小 的 主 存 
块 ， 可 以 实现 共享 。 


4.3.2 ”存储 管理 方案 


存储 管理 的 主要 目的 是 解决 多 个 用 户 使 用 主 存 的 问题 ， 其 存储 管理 方案 主要 包括 分 区 存储 
管理 、 分 页 存储 管理 、 分 段 存储 管理 、 段 页 式 存储 管理 以 及 虚拟 存储 管理 。 本 小 节 介绍 分 区 存 
储 管理 方案 ， 其 他 存储 管理 方案 将 在 后 续 章节 中 介绍 。 


1. 分 区 存储 管理 
分 
每 个 区 


就 是 分 区 存储 管 


域 分 配给 一 个 用 
方式 


区 存储 管理 是 早期 的 存储 管理 


国 19%6 若 。 数据 库 系统 工程 师 教程 (第 3 版) 


户 作业 使 有 
。 按 划分 方式 不 同 分 


(1) 固定 分 


区 。 固定 分 


区 是 一 种 静态 分 区 方式 ， 


方案 ， 其 基本 思想 是 把 主 存 的 用 户 
日， 并 限定 它们 只 能 在 自己 的 
区 可 分 为 固定 分 


区 域 


区 


运行 ， 


l 


划分 成 若干 个 区 域 ， 
这 种 主 存 分 配方 案 


人 


色 、 


可 变 分 
在 系统 生成 时 已 将 


区 和 可 各 
E 存 划分 为 若 


定位 分 区 。 
F 个 分 


区 ， 


每 个 分 区 的 大 小 可 不 等 。 操 作 系统 通过 主 存 分 配 情况 表 管 理 主 存 。 这 种 方法 的 突出 问题 是 已 分 


配 区 中 存在 未 用 空间 
浪费 。 通 常 将 已 分 配 分 
(2) 可 变 分 


区 。 可 变 分 


原因 
区 内 的 未 用 空间 称 为 零头 或 


故 分 区 的 个 数 是 可 变 的 
其 中 已 分 配 表 记 录 已 分 
对 于 可 变 分 


"器 


， 分 
配 分 


是 程序 或 作业 的 大 小 不 可 能 刚好 等 于 分 


内 碎片 。 


区 的 大 小 ， 故 造成 了 空间 的 


区 是 一 种 动态 分 区 方式 ， 存 储 空间 的 划分 是 在 作业 装 入 时 进行 的 ， 
区 的 大 小 刚好 等 于 作业 的 大 小 。 可 变 分 区 分 配 需要 两 种 管理 
区 的 情况 ， 未 分 配 表 记 录 未 分 配 分 区 的 情况 。 
区 的 请 求 和 释放 分 区 主要 有 如 下 4 种 算法 。 


表格 ， 


Q@ 最 佳 适应 算法 。 假 设 系 统 中 有 nn 个 空白 区 (自由 区 )， 每 当 用 户 申请 一 个 空间 时 ， 将 从 


这 nn 个 空 


区 中 找到 


个 最 接近 用 户 需 求 的 分 


区 不 可 能 刚好 等 于 用 户 


@ 最 差 适 
区 一 分 为 二 ， 所 以 剩 下 
@ 首次 适 
个 能 装 入 作业 的 空白 


要 求 的 


的 空 


开始 寻找 一 个 能 满足 用 
引入 可 变 分 
分 配 和 回收 中 ， 必 定 会 


作业 要 求 的 空间 ， 但 是 由 于 不 连续 而 无 法 分 配 ， 产 生 了 未 分 配 


片 。 解 决 碎片 的 方法 是 拼接 〈 或 称 紧 凑 )， 即 向 一 个 方向 《例如 向 低地 址 端 ) 移动 已 分 配 的 作 


业 ， 使 那些 零散 的 小 空 


区 后 虽然 主 存 的 分 


户 要 求 的 空 


区 。 


出 现 一 些 不 连续 的 小 的 空闲 


闲 区 在 另 一 个 方向 连 成 一 片 


(3) 可 重 定位 分 区 


o 


移动 所 有 已 分 配 好 的 分 区 
氟 ” 一样。 分 区 “ 靠 氟 ” 


配 更 灵活 ， 也 提高 了 主 存 的 利用 


区 。 这 种 算法 能 保留 较 大 的 空 
区 ， 所 以 必然 要 将 一 个 分 区 一 分 为 二 ， 但 是 随 着 系统 不 断 地 释放 
空间 ， 可 能 会 使 产生 的 小 分 区 小 到 无 法 再 继续 分 配 ， 将 这 样 的 无 用 小 分 区 称 为 外 碎片 。 

应 算法 。 系 统 总 是 将 用 户 作业 装 入 最 大 的 空白 分 
区 通常 也 大 ， 不 容易 产生 外 碎片 。 
应 算法 。 每 当 用 户 作 业 申 请 一 个 空间 时 ， 系 统 总 是 从 主 存 
区 。 当 用 户 释放 空间 时 ， 该 算法 更 易 实现 相信 
@@ 循环 首次 适应 算法 。 与 首次 适应 算法 的 不 同 之 处 是 ， 每 次 分 配 都 是 从 刚 分 配 的 空 


的 空白 


区 ， 缺 点 是 空闲 


区 。 这 种 算法 将 一 个 最 大 的 分 


的 低地 址 天 


区 合并 。 


F 始 选择 一 


区 


率 , 但 


是 


区 ， 尽 管 这 些小 的 空闲 


于 系统 在 不 断 地 
区 的 总 和 超过 某 一 个 


区 的 无 用 空 


可 重 定位 分 区 是 解决 碎片 问题 的 简单 且 行 之 有 效 
， 使 之 成 为 连续 区 域 。 如 同 队列 有 一 个 队员 出 列 ， 指 挥 员 叫 大 家 “ 靠 
的 时 机 是 当 用 户 请 求 空间 得 不 到 满足 时 或 某 个 作业 执行 完毕 时 。 
靠拢 是 要 代价 的 ， 所 以 通常 是 在 用 户 请 求 空间 得 不 到 满足 时 进行 。 需 要 注意 的 是 ， 当 进 
“靠拢 ”时 会 导致 地 址 发 生变 化 ， 所 以 有 地 址 本 


定位 问题 。 


间 ， 通 常 称 之 为 外 碎 


的 方法 。 基 本 思想 是 


由 于 


行 分 区 
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2. 分 区 保护 


分 区 保护 的 目的 是 防止 未 经 核准 的 用 户 访问 分 区 ， 常 用 如 下 两 种 方式 。 
(1) 采用 上 界 / 下 界 寄存 器 保护 。 上 界 寄存 器 中 存放 的 是 作业 的 装 入 地 址 ， 下 界 寄存 器 中 装 
入 的 是 作业 的 结束 地 址 ， 形 成 的 物理 地 址 必须 满足 如 下 条 件 : 
上 界 寄存 器 三 物理 地 址 三 下 界 寄存 器 
(2) 采用 基 址 / 限 长 寄存 器 保护 。 基 址 寄存 器 中 存放 的 是 作业 的 装 入 地 址 ， 限 长 寄存 器 中 装 
入 的 是 作业 的 长 度 ， 形 成 的 物理 地 址 必须 满足 如 下 条 件 : 
基 址 寄存 器 物理 地 址 < 基 址 寄存 器 + 限 长 寄存 器 


4.3.3 分 页 存储 管理 


尽管 分 区 管理 方案 是 解决 多 道 程序 共享 主 存 的 可 行 方案 , 但 是 该 方案 的 主要 问题 是 用 户 程 
序 必须 装 入 连续 的 地 址 空间 中 ， 若 无 满足 用 户 要 求 的 连续 空间 ， 需 要 进行 分 区 靠拢 操作 ， 这 是 
以 耗费 系统 时 间 为 代价 的 。 为 此 ， 引 入 了 分 页 存储 管理 方案 。 


1， 纯 分 页 存储 管理 


1) 分 页 原理 

将 一 个 进程 的 地 址 空间 划分 成 若干 个 大 小 相等 的 区 域 ， 称 为 页 。 相 应 地 ， 将 主 存 空间 划分 
成 与 页 相同 大 小 的 若干 个 物理 块 ， 称 为 块 或 页 框 。 在 为 进程 分 配 主 存 时 ， 将 进程 中 若干 页 分 别 
装 入 多 个 不 相 邻 接 的 块 中 。 

2) 地 址 结构 

分 页 系统 的 地 址 结构 如 图 4-16 所 示 ， 它 由 两 部 分 组 成 : 前 一 部 分 为 页 号 P; 后 一 部 分 为 偏 
移 量 所 即 页 内 地 址 。 图 中 的 地 址 长 度 为 32 位 ， 其 中 ，0 一 11 位 为 页 内 地 址 (每 页 的 大 小 为 
4KB)，12 一 31 位 为 页 号 ， 所 以 允许 地 址 空间 的 大 小 最 多 为 1MB 个 页 。 

31 12 11 0 
页 号 页 内 地 址 


图 4-16 分 页 地 址 结构 


3) 页 表 

当 进 程 的 多 个 页 面 离散 地 分 配 到 主 存 的 多 个 物理 块 时 ,系统 应 能 保证 在 主 存 中 找到 进程 要 
访问 的 页 面 所 对 应 的 物理 块 。 为 此 ， 系 统 为 每 个 进程 建立 了 一 张 页 面 映射 表 ， 简 称 页 表 〈 如 图 
4-17 所 示 )。 每 个 页 在 页 表 中 占 一 个 表 项 ， 记 录 该 页 在 主 存 中 对 应 的 物理 块 号 。 
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例如 ， 进 程 在 执行 时 ， 系 统 通 过 查找 页 表 就 可 以 找到 每 页 所 对 应 的 物理 块 号 。 图 4-17 中 
逻辑 页 号 为 4, 查找 页 表 可 得 该 页 的 物理 块 号 为 15, 与 页 内 地 址 256 拼接 得 到 物理 地 址 。 可见， 
页 表 的 作用 是 实现 从 页 号 到 物理 块 号 的 地 址 映射 。 

页 表 始 址 寄存 器 页 表 长 度 寄存 器 页 号 页 内 地 址 
L 4 256 “| 逻辑 地 址 


二 


< 
页 号 ”物理 块 号 | 若 L< 页 号 , 则 地 址 越界 


Es 5 一 一 | 15 | 256 | 物理 地 址 


图 4-17 页 式 存储 管理 的 地 址 映射 


地 址 变换 机 构 的 基本 任务 是 利用 页 表 把 用 户 程序 中 的 逻辑 地 址 变换 成 主 存 中 的 物理 地 址 ， 
实际 上 就 是 将 用 户 程序 中 的 页 号 变换 成 主 存 中 的 物理 块 号 。 为 了 实现 地 址 变换 功能 ， 在 系统 中 
设置 页 表 寄存 器 ， 用 来 存放 页 表 的 始 址 和 页 表 的 长 度 。 在 进程 未 执行 时 ， 每 个 进程 对 应 的 页 表 
的 始 址 和 长 度 存放 在 进程 的 PCB 中 ， 当 该 进程 被 调度 时 ， 则 将 它们 装 入 页 表 寄 存 器 。 在 进行 地 
址 变换 时 , 系统 将 页 号 与 页 表 长 度 进行 比较 , 如 果 页 号 大 于 等 于 页 表 寄存 器 中 的 页 表 长 度 乙 (页 
号 从 0 开始 )， 则 访问 越界 ， 产 生 越 界 中 断 。 若 未 出 现 越界 ， 则 根据 页 表 寄 存 器 中 的 页 表 始 址 
和 页 号 计算 出 该 页 在 页 表 项 中 的 位 置 ， 得 到 该 页 的 物理 块 号 ， 将 此 物理 块 号 装 入 物理 地 址 寄存 
器 中 。 与 此 同时 ， 将 有 效 地 址 〈 逻 辑 地 址 ) 寄存 器 中 页 内 地 址 直接 装 入 物理 地 址 寄存 器 的 块 内 
地 址 字段 中 ， 这 样 便 完 成 了 从 逻辑 地 址 到 物理 地 址 的 变换 。 


2， 快 表 


从 地 址 映射 的 过 程 可 以 发 现 ， 页 式 存储 管理 至 少 需要 两 次 访问 主 存 。 例 如 ， 第 一 次 是 访问 
页 表 ， 得 到 的 是 数据 的 物理 地 址 ; 第 二 次 是 存 取 数据 ; 若 该 数据 是 间接 地 址 ， 还 需要 再 进行 地 
址 变换 ， 再 存 取 数 据 ， 显 然 访 问 主 存 的 次 数 大 于 2。 为 了 提高 访问 主 存 的 速度 ， 可 以 在 地 址 映 
射 机 构 中 增加 一 组 高 速 寄存 器 ， 用 来 保存 页 表 。 这 种 方法 需要 大 量 的 硬件 开销 ， 在 经 济 上 是 不 
可 行 的 。 另 一 种 方法 是 在 地 址 映射 机 构 中 增加 一 个 小 容量 的 联想 存储 器 ， 联 想 存储 器 由 一 组 高 
速 存 储 器 组 成 ， 称 之 为 快 表 ， 用 来 保存 当前 访问 频率 高 的 少数 活动 页 的 页 号 及 相关 信息 。 
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联想 存储 器 存放 的 只 是 当前 进程 最 活跃 的 少数 几 页 的 物理 块 号 , 这 样 用 户 程序 要 访问 数据 
时 ， 系 统 根据 数据 的 逻辑 页 号 在 联想 存储 器 中 找 出 对 应 的 物理 块 号 ,然后 与 页 内 地 址 拼接 形成 
物理 地 址 ; 若 找 不 到 ， 则 地 址 映射 仍 通过 主 存 的 页 表 进 行 ， 得 到 物理 地 址 后 ， 需 将 物理 块 号 填 
入 联想 存储 器 的 空闲 单元 中 ， 若 无 空闲 单元 ， 则 根据 淘汰 算法 淘汰 某 一 页 ， 再 填 入 新 得 到 的 页 
号 。 事 实 上 ， 查 找 联想 存储 器 和 查找 主 存 页 表 是 并 行进 行 的 ， 一 旦 在 联想 存储 器 中 找到 相符 的 
逻辑 页 号 ， 就 停止 查找 主 存 页 表 。 


3. 两 级 页 表 机 制 


大 家 知道 ，80386 的 逻辑 地 址 有 2” 个 ， 若 页 面 大 小 为 4KB (22B)， 则 页 表 项 达 1MB 个 ， 
每 个 页 表 项 占用 4B， 故 每 个 进程 的 页 表 占 用 4MB 主 存 空间 ， 并 且 还 要 求 是 连续 的 ， 显 然 这 是 
不 现实 的 。 为 了 减少 页 表 所 占用 的 连续 的 主 存 空间 ， 在 80386 中 采用 了 两 级 页 表 机 制 。 基 本 方 
法 是 将 页 表 进 行 分 页 ， 每 个 页 面 的 大 小 与 主 存 物理 块 的 大 小 相同 ， 并 为 它们 进行 编号 ， 可 以 离 
散 地 将 各 个 页 面 分 别 存放 在 不 同 的 物理 块 中 。 为 此 需要 建立 一 张 页 表 ， 称 为 外 层 页 表 ( 页 表 目 
录 )， 即 第 一 级 是 页 目录 表 ， 其 中 的 每 个 表 目 是 存放 某 个 页 表 的 物理 地 址 ， 第 二 级 是 页 表 ， 其 
中 的 每 个 表 目 所 存放 的 是 页 的 物理 块 号 。 

两 级 页 表 的 逻辑 地 址 结构 和 两 级 页 表 的 地 址 变换 机 构 如 图 4-18 所 示 。 

虚拟 地 址 
外 层 页 号 P ”| ”外 层 页 内 地 址 P， | 页 内 地 址 d 


L_ 外 层 页 表 寄 存 器 二 -| 


图 4-18 两 级 页 表 的 地 址 变换 机 构 


4.3.4 “分 段 存储 管理 


在 分 段 存储 管理 方式 中 ,作业 的 地 址 空间 被 划分 为 若干 个 段 ， 每 个 段 是 一 组 完整 的 逻辑 信 
息 ， 例 如 有 主 程 序 段 、 子 程序 段 、 数 据 段 及 堆栈 段 等 ， 每 个 段 都 有 自己 的 名 字 ， 都 是 从 0 开始 
编 址 的 一 段 连续 的 地 址 空间 ， 各 段 的 长 度 是 不 等 的 。 分 段 系 统 的 地 址 结构 如 图 4-19 所 示 ， 风 辑 
地 址 由 段 号 (名 ) 和 段 内 地 址 两 部 分 组 成 。 在 该 地 址 结构 中 ， 允许 一 个 作业 最 多 有 64 KB 个 段 ， 
每 个 段 的 最 大 长 度 为 64 KB。 
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31 1615 0 
段 号 s 段 内 地 址 4 
图 4-19 分 段 的 地 址 结构 


在 分 段 式 存储 管理 系统 中 ， 为 每 个 段 分 配 一 个 连续 的 分 区 ， 而 进程 中 的 各 个 段 可 以 离散 地 
分 配 到 主 存 的 不 同 分 区 中 。 在 系统 中 为 每 个 进程 建立 一 张 段 映 射 表 ， 简 称 为 “ 段 表 ”。 每 个 段 
在 表 中 占有 一 个 表 项 ， 在 其 中 记录 了 该 段 在 主 存 中 的 起 始 地 址 (又 称 为 “ 基 址 ”) 和 有 段 的 长 度 ， 
如 图 4-20 所 示 。 进 程 在 执行 时 ， 通 过 查 段 表 来 找到 每 个 段 所 对 应 的 主 存 区 。 可 见 ， 段 表 实 现 了 
从 逻辑 段 到 物理 主 存 区 的 映射 。 

为 了 实现 从 逻辑 地 址 到 物理 地 址 的 变换 功能 ， 系 统 中 设置 了 段 表 寄存 器 ， 用 于 存放 段 表 始 
址 和 段 表 长 度 。 在 进行 地 址 变换 时 ， 系 统 将 逻辑 地 址 中 的 段 号 5 与 段 表 长 度 L 进行 比较 。 若 
S2Z， 表 示 段 号 太 大， 访问 越界 ， 于 是 产生 越界 中 断 信 号 ; 若 未 越界 ， 则 根据 段 表 的 始 址 和 该 
段 的 段 号 ， 计 算出 该 段 对 应 段 表 项 的 位 置 ， 从 中 读 出 该 段 在 主 存 中 的 起 始 地 址 ， 然 后 再 检查 段 
内 地 址 d 是 否 超过 该 段 的 段 长 SL。 若 超过 ， 即 d 宇 SL， 同 样 发 出 越界 中 断 信 号 ， 若 未 越界 ， 则 
将 该 段 的 基 址 5 与 段 内 地 址 d 相 加 ， 得 到 要 访问 的 主 存 物理 地 址 。 


段 表 寄存 器 地 址 越界 逻辑 地 址 
段 表 起 始 地 址 | 段 表 长 度 L 段 号 S | 段 内 地 址 4 


= 一 一 
段 号 8 段 长 二 基 址 


Pn 


| rt da 


物理 地 址 


1 
2 
3 
4 


图 4-20 段 式 存储 管理 的 地 址 变换 机 构 
【 例 4.9】 系统 采用 段 式 存储 管理 方案 ,假设 某 作业 的 段 表 如 下 : 
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(1) 逻辑 地 址 (0，168)、(1，58)、(2，98)、(3，300) 和 “4，100) 能 否 转换 为 对 应 的 
物理 地 址 ? 为 什么 ? 

(2) 将 问题 (1) 的 逻辑 地 址 分 别 转换 成 对 应 的 物理 地 址 。 

解 : 
(1) 逻辑 地 址 (0，168)、(1，58)、(2，98) 和 (3，300) 可 以 转换 成 对 应 的 物理 地 址 ， 
而 逻辑 地 址 4，100) 不 能 转换 为 对 应 的 物理 地 址 ， 因 为 地 址 越界 。 

(2) 逻辑 地 址 (0，168) 对 应 的 物理 地 址 是 219+168=387; 

逻辑 地 址 (1，58》〉 对 应 的 物理 地 址 是 2300+58=2358; 

逻辑 地 址 (2，98) 对 应 的 物理 地 址 是 90+98=188; 

逻辑 地 址 (3，300) 对 应 的 物理 地 址 是 1327+300=1627。 


4.3.5 段 页 式 存储 管理 


分 页 和 分 段 存储 管理 方式 各 有 其 优 缺 点 。 因 为 分 页 的 过 程 是 由 操作 系统 完成 的 ， 对 用 户 是 
透明 的 ， 所 以 用 户 不 必 关 心 分 页 的 过 程 ， 其 缺点 是 不 易 实现 共享 ， 段 是 信息 的 逻辑 单位 ， 其 优 
点 是 易于 实现 段 的 共享 ， 即 允许 若干 个 进程 共享 一 个 或 多 个 段 ， 而 且 对 段 的 保护 也 十 分 简单 。 
如 果 对 两 种 存储 管理 方式 “各 取 所 长 ” 则 可 以 形成 一 种 新 的 存储 管理 方式 的 系统 “ 段 页 式 系 
统 ”。 这 种 新 系统 既 具有 分 页 系统 能 有 效 地 提高 主 存 利用 率 的 优点 ， 又 具有 分 段 系统 能 很 好 地 
满足 用 户 需 要 的 长 处 ， 显 然 是 一 种 比较 有 效 的 存储 管理 方式 。 

段 页 式 系统 的 基本 原理 是 先 将 整个 主 存 划分 成 大 小 相等 的 存储 块 (页 框 )， 将 用 户 程序 按 
程序 的 逻辑 关系 分 为 若干 个 段 ， 并 为 每 个 段 赋 予 一 个 段 名 ， 再 将 每 个 段 划 分 成 若干 页 ， 以 页 框 
为 单位 离散 分 配 。 在 段 页 式 系统 中 ， 其 地 址 结构 由 段 号 、 段 内 页 号 和 页 内 地 址 三 部 分 组 成 。 作 
业 地 址 空间 的 结构 如 图 4-21 所 示 。 


4-21 段 页 式 管理 的 地 址 结构 


在 段 页 式 系统 中 ,为 了 实现 从 逻辑 地 址 到 物理 地 址 的 变换 ， 系 统 中 必须 同时 配置 段 表 和 页 
表 。 由 于 将 段 中 的 页 进行 离散 的 分 配 ， 段 表 中 的 内 容 不 再 是 段 的 主 存 始 址 和 段 长 ， 而 是 页 表 始 
址 和 页 表 长 度 。 在 段 页 式 系统 中 有 一 个 段 表 寄 存 器 ,用 于 存放 段 表 起 始 地 址 和 段 表 长 度 TL， 其 
地 址 变换 结构 如 图 4-22 所 示 。 
在 段 页 式 系统 中 逻辑 地 址 到 物理 地 址 的 变换 过 程 如 下 : 
(1) 根据 段 号 8 查 段 表 ， 得 到 页 表 的 起 始 地 址 ; 

(2) 根据 页 号 尸 查 页 表 ， 得 到 物理 块 号 b; 
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(3) 将 物理 块 号 b 拼 页 内 地 址 丈 得 到 物理 地 址 。 
段 表 寄 存 器 地 址 越界 逻辑 地 址 


段 表 起 始 地 址 | 段 表 长 度 7L 段 号 9 | 页 号 P | 页 内 地 址 所 
1 > 


Ho 


图 4-22 段 页 式 存 储 管理 的 地 址 变换 结构 


4.3.6 ”虚拟 存储 管理 


在 前 面 介绍 的 存储 管理 方案 中 ， 必 须 为 每 个 作业 分 配 足够 的 空间 ， 以 便装 入 全 部 信息 。 当 
主 存 空间 不 能 满足 作业 要 求 时 ， 作 业 无 法 装 入 主 存 执行 。 

如 果 一 个 作业 只 部 分 装 入 主 存 便 可 开始 启动 运行 ， 其 余部 分 暂时 留 在 磁盘 上 ， 在 需要 时 再 
装 入 主 存 ， 这 样 可 以 有 效 地 利用 主 存 空 间 。 从 用 户 角 度 看 ， 该 系统 所 具有 的 主 存 容 量 将 比 实际 
主 存 容量 大 得 多 ， 人 们 把 这 样 的 存储 器 称 为 虚拟 存储 器 。 虚 拟 存储 器 是 为 了 扩大 主 存 容 量 而 采 
用 的 一 种 设计 方法 ， 其 容量 是 由 计算 机 的 地 址 结构 决定 的 。 


1. 程序 局 部 性 原理 


早 在 1968 年 PDenning 就 指出 ， 程 序 在 执行 时 将 呈现 出 局 部 性 规律 ， 即 在 一 段 时 间 内 ， 程 
序 的 执行 仅 局 限于 某 个 部 分 。 相 应 地 ， 它 所 访问 的 存储 空间 也 局 限于 某 个 区 域内 。 程 序 的 局 限 
性 表现 在 时 间 局 限 性 和 空间 局 限 性 两 个 方面 。 
(1) 时 间 局 限 性 是 指 如 果 程 序 中 的 某 条 指令 一 旦 执行 ， 则 不 和 久 的 将 来 该 指令 可 能 再 次 被 执 
行 ， 如果 某 个 存储 单元 被 访问 ， 则 不 久 以 后 该 存储 单元 可 能 再 次 被 访问 。 产 生 时 间 局 限 性 的 典 
型 原因 是 在 程序 中 存在 着 大 量 的 循环 操作 。 

(2) 空间 局 限 性 是 指 一 旦 程序 访问 了 某 个 存储 单元 ， 则 在 不 久 的 将 来 ， 其 附近 的 存储 单元 
也 最 有 可 能 被 访问 。 即 程序 在 一 段 时 间 内 所 访问 的 地 址 可 能 集中 在 一 定 的 范围 内 ， 其 典型 原因 
是 程序 是 顺序 执行 的 。 
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2. 虚拟 存储 器 的 实现 


虚拟 存储 器 是 具有 请 求 调 入 功能 和 置换 功能 ， 能 仅 把 作业 的 一 部 分 装 入 主 存 便 可 运行 作业 
的 存储 器 系统 ， 是 能 从 逻辑 上 对 主 存 容量 进行 扩充 的 一 种 虚拟 的 存储 器 系统 。 其 逻辑 容量 由 主 
存 和 外 存 容量 之 和 以 及 CPU 可 寻 址 的 范围 来 决定 ， 其 运行 速度 接近 于 主 存 速度 ， 成 本 也 下 降 。 
可 见 ， 虚 拟 存储 技术 是 一 种 性 能 非常 优越 的 存储 器 管理 技术 ， 故 被 广泛 地 应 用 于 大 、 中 、 小 型 
机 器 和 微型 机 中 。 虚 拟 存储 器 的 实现 主要 有 如 下 3 种 方式 。 

(1) 请 求 分 页 系统 。 该 系统 是 在 分 页 系统 的 基础 上 增加 了 请 求 调 页 功能 和 页 面 置换 功能 所 
形成 的 页 式 虚 拟 存储 系统 。 它 允许 只 装 入 若干 页 的 用 户 程序 和 数据 〈 而 非 全 部 程序 ) 就 可 以 启 
动 运行 ， 以 后 再 通过 调 页 功能 和 页 面 置换 功能 陆续 把 将 要 使 用 的 页 面 调 入 主 存 ， 同 时 把 暂 不 运 
行 的 页 面 置 换 到 外 存 上 ， 置 换 时 以 页 面 为 单位 。 

(2) 请 求 分 段 系统 。 该 系统 是 在 分 段 系统 的 基础 上 增加 了 请 求 调 段 和 分 段 置 换 功 能 所 形成 
的 段 式 虚拟 存储 系统 。 它 允许 只 装 入 若干 段 的 用 户 程序 和 数据 就 可 以 启动 运行 ， 以 后 再 通过 调 
段 功 能 和 置换 功能 将 不 运行 的 段 调 出 ， 同 时 调 入 将 要 运行 的 段 ， 注 意 : 置换 时 以 段 为 单位 。 

(3) 请 求 段 页 式 系统 。 该 系统 是 在 段 页 式 系统 的 基础 上 增加 了 请 求 调 页 和 页 面 置换 功能 所 
形成 的 段 页 式 虚 拟 存储 系统 。 


3. 请求 分 页 管理 的 实现 


请 求 分 页 是 在 纯 分 页 系统 的 基础 上 增加 了 请 求 调 页 功能 、 页面 置 换 功 能 所 形成 的 页 式 虚 拟 
存储 系统 ， 它 是 目前 常用 的 一 种 虚拟 存储 器 的 方式 。 

请 求 分 页 的 页 表 机 制 是 在 纯 分 页 的 页 表 机 制 上 形成 的 ， 由 于 只 将 应 用 程序 的 一 部 分 调 入 主 
存 ,， 还 有 一 部 分 仍 在 磁盘 上 ， 故 需 在 页 表 中 再 增加 若干 项 (如 状态 位 、 访 问 字段 和 辅 存 地 址 等 ) 
供 程序 〈 数 据 ) 在 转 进 、 转 出 时 参考 。 

请 求 分 页 系统 中 的 地 址 变换 机 构 是 在 分 页 系统 的 地 址 变换 结构 的 基础 上 增加 了 某 些 功能 ， 
如 产生 和 处 理 缺 页 中 断 、 从 主 存 中 转 出 一 页 实现 虚拟 存储 。 

在 请 求 分 页 系统 中 ， 每 当 所 要 访问 的 页 面 不 在 主 存 时 便 要 产生 一 个 缺 页 中 断 ， 请 求 OS 将 
所 缺 的 页 调 入 主 存 ， 这 是 由 缺 页 中 断 机构 完 成 的 。 缺 页 中 断 与 一 般 中 断 的 主要 区 别 如 下 。 

(1) 缺 页 中 断 在 指令 执行 期 间 产 生 和 处 理 中 断 信号 ， 而 一 般 中 断 在 一 条 指令 执行 完 ， 下 一 
条 指令 开始 执行 前 检查 和 处 理 中 断 信号 。 

(2) 发 生 缺 页 中 断 时 ， 返 回 到 被 中 断 指 令 的 开始 重新 执行 该 指令 ， 而 一 般 中 断 返回 到 下 一 
条 指令 执行 。 
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(3) 一 条 指令 在 执行 期 间 可 能 会 产生 多 次 缺 页 中 断 。 
【 例 4.10】 在 某 计 算 机 中 ， 假 设 某 程序 的 COPY 指令 跨 两 个 页 面 ， 且 源 地 址 A 和 目标 地 
址 B 所 涉及 的 区 域 也 跨 两 个 页 面 ， 如 下 图 所 示 。 


页 号 


5| B 
4 


: 


1 | 指令 
copy A 
0 To_ B 


若 地 址 为 A 和 B 的 操作 数 均 不 在 内 存 ， 计 算 机 执行 COPY 指令 时 ， 系 统 将 产生 (1) 缺 
页 中 断 ; 若 系 统 产生 3 次 缺 页 中 断 ， 那 么 该 程序 有 _〈2》 个 页 面 在 内 存 。 


(DA.2 B. 3 C. 4 D. 5 
(2) A. 2 B. 3 C. 4 D: 5 
例题 分 析 


从 例题 的 图 中 可 以 看 到 ， 程 序 的 COPY 指令 跨 两 个 页 面 ， 且 源 地 址 A 和 目标 地 址 B 所 涉 
及 的 区 域 也 跨 两 个 页 面 页 内 地 址 ， 这 时 ， 如 果 2、3、4 和 5 号 页 面 不 在 内 存 ， 系 统 执行 “COPY 
ATO B?” 指 令 时 ， 取 地 址 为 A 的 操作 数 。 由 于 该 操作 数 不 在 内 存 且 跨 两 个 页 面 2、3， 需 要 将 2、 
3 页 面 装 入 内 存 ， 所 以 产生 两 次 缺 页 中 断 。 同 理 ， 取 地 址 为 B 的 操作 数 ， 由 于 该 操作 数 不 在 内 
存 且 跨 两 个 页 面 4 和 5， 需 要 将 4 和 5 页 面 装 入 内 存 ， 所 以 产生 两 次 缺 页 中 断 ， 共 产生 4 次 缺 
页 中 断 。 故 例题 空 (1) 的 正确 答案 为 C。 
同 理 ， 如 果 1、2、3 号 页 面 不 在 内 存 ， 系 统 执行 “COPY A TO B” 指 令 时 ， 由 于 程序 的 
COPY 指令 跨 两 个 页 面 ， 当 取出 指令 分 析 是 多 字 节 的 ， 那 么 系统 将 产生 一 次 缺 页 中 断 取 指令 的 
后 半 部 分 ， 当 取 地 址 为 A 的 操作 数 ， 由 于 该 操作 数 不 在 内 存 ， 且 跨 两 个 页 面 2 和 3， 需 要 将 2 
和 3 页 面 装 入 内 存 ， 所 以 产生 两 次 缺 页 中 断 ， 共 产生 3 次 缺 页 中 断 。 故 例题 空 (2) 的 正确 答 
案 为 B。 


4. 页 面 置换 算法 


请 求 分 页 是 在 纯 分 页 系统 的 基础 上 增加 了 请 求 调 页 功能 、 页 面 置换 功能 所 形成 的 页 式 虚 拟 
存储 系统 ， 它 是 目前 常用 的 一 种 虚拟 存储 器 的 方式 。 在 进程 运行 过 程 中 ， 如 果 发 生 缺 页 ， 此 时 
主 存 中 又 无 空闲 块 时 ， 为 了 保证 进程 能 正常 运行 ， 必 须 从 主 存 中 调 出 一 页 程序 或 数据 送 磁盘 的 
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对 换 区 。 但 究竟 将 哪个 页 面 调 出 ， 需 要 根据 一 定 的 页 面 置换 算法 来 确定 。 置 换算 法 的 好 坏 将 直 
接 影响 系统 的 性 能 ， 不 适当 的 算法 可 能 会 导致 系统 发 生 “抖动 ”(Thrashing)。 即 刚 被 换 出 的 页 
很 快 又 被 访问 ， 需 重新 调 入 ， 导 致 系统 频繁 地 更 换 页 面 ， 以 至 于 一 个 进程 在 运行 中 把 大 部 分 时 
间 花 费 在 完成 页 面 置 换 的 工作 上 ， 这 种 现象 称 为 系统 发 生 了 “ 拌 动 ”( 也 称 颠 笋 )。 请 求 分 页 系 
统 的 核心 问题 是 选择 合适 的 页 面 置换 算法 ， 常 用 的 页 面 置换 算法 如 下 所 述 。 

1) 最 佳 COptimal) 置换 算法 

这 是 一 种 理想 化 的 算法 ， 即 选择 那些 是 永 不 使 用 的 ， 或 者 是 在 最 长 时 间 内 不 再 被 访问 的 页 
面 置 换 出 去 。 这 种 方法 性 能 最 好 ， 但 实际 上 难于 实现 。 并 且 要 确定 哪 一 个 页 面 是 未 来 最 长 时 间 
内 不 再 被 访问 的 是 很 难 的 ， 所 以 该 算法 通常 用 来 评价 其 他 算法 。 

【 例 4.11】 假定 系统 为 进程 P1 分 配 了 3 个 物理 块 ， 该 进程 访问 页 面 的 顺序 为 “0，7，6， 
5，7，4，7，3，5，4，7，4，5，6，5，7，6，0，7，6”， 利 用 最 佳 置换 算法 的 结果 如 图 4-23 
所 示 ， 图 中 x 表示 产生 缺 页 中 断 。 求 缺 页 中 断 次 数 、 页 面 置换 次 数 和 缺 页 率 。 

mm or er slits trl sts ss sis ro 
sls|slslslslslslslslslslslslololo| 


时 区 归 富 要 员 量 量 中 要 业 守 费时 要 时 本 蜡 旨 师 
器 | | 15lslsl4414141414141415lslalslslslal 
| ww |x|x|[x[xl xl [xT xx xl 


4-23 ”最 佳 置换 算法 

例题 分 析 : 根据 题 意 系统 为 Pl 分 配 了 3 个 物理 块 ， 故 P1 开始 运行 申请 的 0、7、6 三 个 页 
将 产生 缺 页 中 断 ， 但 不 需要 置换 页 面 〈 因 为 刚 开 始 分 配 的 内 存 物理 块 “ 空 闲 ”; 关 ne 
看 5 时 产生 缺 页 中 断 ， 由 于 页 面 0 将 在 第 18 次 才 被 访问 ， 根 据 最 佳 置换 算法 0，7，6 三 页 
中 0 页 将 是 最 久 不 被 访问 的 页 面 ， 所 以 被 淘汰 ， 接着 访问 页 面 7， 发 现 已 在 主 存 中 ， 不 会 产生 
缺 页 中 断 ， 以 此 类 推 。 
从 上 分 析 可 知 ， 采 用 最 佳 置换 算法 产生 了 9 次 缺 页 中 断 ， 发 生 了 6 次 页 面 置换 (前 3 次 无 
页 面 置换 )， 缺 页 率 广 缺 页 次 数 /访问 次 数 =9/20=45%。 

2) 先进 先 出 〈FIFO) 置换 算法 

该 算法 总 是 淘汰 最 先进 入 主 存 的 页 面 ， 即 选择 在 主 存 中 驻 留 时 间 最 久 的 页 面 予以 淘汰 。 该 
算法 实现 简单 ， 只 需 把 一 个 进程 调 入 主 存 的 页 面 ， 按 先后 次 序 链接 成 一 个 队列 ， 并 设置 一 个 指 
针 即 可 。 它 是 一 种 最 直观 、 性 能 最 差 的 算法 ， 有 Belady 异常 现象 。 所 谓 Belady 异常 现象 ， 是 
指 如 果 对 一 个 进程 未 分 配 它 所 要 求 的 全 部 页 面 ， 有 时 就 会 出 现 分 配 的 页 面 数 增多 但 缺 页 率 反而 
提高 的 异常 现象 。 例 如 ， 对 于 页 面 访问 序列 “1，2，3，4，1，2，5，1，2，3，4，5”， 当 分 
配 的 物理 块 从 3 块 增加 到 4 块 时 ， 有 缺 页 次 数 增 加 、 缺 页 率 提高 的 异常 现象 。 

【 例 4.12】 假定 系统 中 某 进程 访问 页 面 的 顺序 为 “0，7，6，5，7，4，7，3，5，4，7，4， 
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5，6，5，7，6，0，7，6”， 利 用 FIFO 算法 对 上 例 进行 页 面 置换 的 结果 如 图 4-24 所 示 。 


访问 JI 面 | o|7|6|5|7|4|7|3|15|14|7141516|5|17|6|ol7|15 
物 ololels[l7l4lsl3|sl3|7l4ls[lele|l7l7lololso 
理 7|o|s|5|l7|7|4|3|5|3|7|141515|16slsl7|7|， 
块 7|o|s|l5|l5|7|4|4|5|13|7|14|141515|16|6|4 
缺 页 x|x|x|x|x|x x|x x| x| x| x X X 


图 4-24 ”先进 先 出 置换 算法 


分 析 略 。 从 图 4-24 中 可 见 , 发生 了 14 次 缺 页 中 断 ， 页 面 置换 11 次 ， 缺 页 率 广 14/20=70%。 

3) 最 近 最 少 未 使 用 (Least Recently Used，LRU) 置换 算法 

该 算法 是 选择 最 近 最 少 未 使 用 的 页 面 予以 淘汰 ， 系 统 在 每 个 页 面 设置 一 个 访问 字段 ， 用 于 
记录 这 个 页 面 自 上 次 被 访问 以 来 所 经 历 的 时 间 T7， 当 要 淘汰 一 个 页 面 时 ， 选 择 了 最 大 的 页 面 ， 
但 在 实现 时 需要 硬件 的 支持 寄存 器 或 栈 )。 

【 例 4.13】 假定 系统 中 某 进程 访问 页 面 的 顺序 为 “0,7,，6,，5, 7, 4, 7, 3, 5, 4, 7, 4， 


5，6，5，7，6，0，7，6”， 利 用 LRU 算法 对 上 例 进行 页 面 置换 的 结果 如 图 4-25 所 示 。 


em ofr el sr slr sr ss eos 
erstshr elals a sse ls eos 


图 4-25 最 近 最 少 未 使 用 置换 算法 


分 析 略 。 从 图 4-25 中 可 见 ， 发 生 了 13 次 缺 页 中 断 ， 页 面 置 换 10 次 ， 缺 页 率 . 广 13/20=65%。 

4) 最 近 未 用 (Not Used Recently，NUR ) 置换 算法 

NUR 算法 将 最 近 一 段 时 间 未 引用 过 的 页 面 换 出 ， 这 是 一 种 LRU 的 近似 算法 。 该 算法 为 每 
个 页 面 设置 一 位 访问 位 ， 将 主 存 中 的 所 有 页 面 都 通过 链接 指针 链 成 一 个 循环 队列 。 当 某 页 被 访 
问 时 ,其 访问 位 置 1。 在 选择 一 页 淘汰 时 ,检查 其 访问 位 ， 如 果 是 0， 则 选择 该 页 换 出 ; 若 为 1， 
则 重新 置 为 0， 暂 不 换 出 该 页 ， 在 循环 队列 中 检查 下 一 个 页 面 ， 直 到 访问 位 为 0 的 页 面 为 止 。 
于 该 算法 只 有 一 位 访问 位 ， 只 能 用 它 表 示 该 页 是 否 已 经 使 用 过 ， 而 置换 时 是 将 未 使 用 过 的 页 
面 换 出 去 ， 所 以 把 该 算法 称 为 最 近 未 用 算法 。 

5. 工作 集 


事实 上 , 程序 在 运行 中 所 产生 的 缺 页 情况 会 影响 程序 的 运行 速度 及 系统 性 能 ， 而 缺 页 率 的 
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高 低 又 与 每 个 进程 所 占用 的 物理 块 数目 有 关 。 那 么 ， 究 竟 应 该 为 每 个 进程 分 配 多 少 个 物理 块 才 
把 缺 页 率 保持 在 一 个 合理 的 水 平 上 ? 否则 会 因为 进程 频繁 地 从 辅 存 请 求 页 面 而 出 现 “ 其 笋 ” 
(也 称 拌 动 ) 现象 。 为 了 解决 这 一 问题 ， 引 入 了 工作 集 理论 。 
工作 集 的 理论 是 1968 年 由 Denning 提出 的 ， 他 认为 ， 虽 然 程序 只 需 有 少量 的 几 页 在 主 存 
就 可 以 运行 ， 但 为 了 使 程序 能 够 有 效 地 运行 ， 较 少 地 产生 缺 页 ， 必 须 使 程序 的 工作 集 驻 留 在 主 
存 中 。 把 某 进 程 在 时 间 上 的 工作 集 记 为 w(t, 4 ), 变量 4 称 为 工作 集 “ 窗 口 尺 寸 (Windows Size)”。 
正确 地 选择 工作 集 窗口 〈4 ) 的 大 小 ， 对 存储 器 的 有 效 利 用 和 系统 吞吐 量 的 提高 都 将 产生 重大 
的 影响 。 可 见 工作 集 就 是 指 在 某 段 时 间 间 隔 〈 4 ) 里 进程 实际 要 访问 的 页 面 的 集合 。 
程序 在 运行 时 对 页 面 的 访问 是 不 均匀 的 ， 即 往往 在 某 段 时 间 内 的 访问 仅 局 限于 较 少 的 若干 
个 页 面 ， 如 果 能 够 预知 程序 在 某 段 时 间 间 隔 内 要 访问 哪些 页 面 ， 并 能 将 它们 提前 调 入 主 存 ， 将 
会 大 大 地 降低 缺 页 率 ， 从 而 减少 置换 工作 ， 提 高 CPU 的 利用 率 。 当 每 个 工作 集 都 已 达到 最 小 
值 时 ， 虚 存 管理 程序 跟踪 进程 的 缺 页 数量 ， 根 据 主 存 中 自由 页 面 的 数量 可 以 适当 增加 其 工作 集 
的 大 小 。 


4.4 设备 管理 


设备 管理 是 操作 系统 中 最 繁杂 而 且 与 硬件 紧密 相关 的 部 分 。 设 备 管理 不 仅 要 管理 实际 IO 
操作 的 设备 〈 如 键盘 、 上 鼠标、 打印 机 等 )， 还 要 管理 诸如 设备 控制 器 、DMA 控制 器 、 中 断 控制 
器 和 IJ/O 处 理 机 (通道 ) 等 支持 设备 。 设 备 管理 包括 各 种 设备 分 配 、 缓 冲 区 管理 和 实际 物理 TO 
设备 操作 ， 通 过 管理 达到 提高 设备 利用 率 和 方便 用 户 的 目的 。 


4.4.1 概述 


设备 是 计算 机 系统 与 外 界 交互 的 工具 , 具体 负责 计算 机 与 外 部 的 输入 /输出 工作 , 所 以 常 称 
为 外 部 设备 (简称 外 设 )。 在 计算 机 系统 中 ， 将 负责 管理 设备 和 输入 /输出 的 机 构 称 为 TO 系统 。 
因此 ，IO 系统 由 设备 、 控 制 器 、 通 道 《 具 有 通道 的 计算 机 系统 )、 总 线 和 IO 软件 组 成 。 


1. 设备 的 分 类 


现代 计算 机 系统 都 配 有 各 种 各 样 的 设备 ， 如 打印 机 、 显 示 器 、 绘 图 仪 、 扫 描 仪 、 键 盘 和 鼠 
标 等 。 设 备 可 以 有 各 种 不 同 的 分 类 方式 。 

(1) 按 数据 组 织 分 类 。 分 为 块 设备 〈(Block Device) 和 字符 设备 〈Character Device )。 块 设 
备 是 指 以 数据 块 为 单位 来 组 织 和 传送 数据 信息 的 设备 ， 如 磁盘 。 字 符 设备 是 指 以 单个 字符 为 单 
位 来 传送 数据 信息 的 设备 ， 如 交互 式 终端 、 打 印 机 等 。 

(2) 按照 设备 的 功能 分 类 。 分 为 输入 设备 、 输 出 设备 、 存 储 设备 、 网 络 联网 设备 、 供 电 设 
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备 等 等 。 输 入 设备 是 将 数据 、 图 像 、 声 音 送 入 计算 机 的 设备 ; 输出 设备 是 将 加 工 好 的 数据 显示 、 
印 制 、 再 生出 来 的 设备 ， 存 储 设备 是 指 能 进行 数据 或 信息 保存 的 设备 ， 网 络 联网 设备 是 指 网 络 
互 连 设 备 以 及 直接 连接 上 网 的 设备 ， 供 电 设备 是 指向 计算 机 提供 电力 能 源 、 电 池 后 备 的 部 件 与 
设备 ， 如 开关 电源 、 联 机 UPS 等 。 

(3) 从 资源 分 配角 度 分 类 。 分 为 独占 设备 、 共 享 设备 和 虚拟 设备 。 独 占 设 备 是 指 在 一 段 时 
间 内 只 允许 一 个 用 户 〈 进 程 ) 访问 的 设备 ， 大 多 数 低速 的 IO 设备 〈 如 用 户 终端 、 打 印 机 等 ) 
属于 这 类 设备 。 共 享 设备 是 指 在 一 段 时 间 内 允许 多 个 进程 同时 访问 的 设备 。 显 然 ， 共 享 设 备 必 
须 是 可 寻 址 的 和 可 随机 访问 的 设备 。 典 型 的 共享 设备 是 磁盘 。 虚 拟 设备 是 指 通过 虚拟 技术 将 一 
台独 占 设 备 变换 为 若干 台 供 多 个 用 户 〈 进 程 ) 共享 的 逻辑 设备 。 一 般 可 以 利用 假 脱 机 技术 
(Spooling 技术 ) 实现 虚拟 设备 。 

(4) 按 数据 传输 率 分 类 。 分 为 低速 设备 、 中 速 设备 和 高 速 设备 。 低 速 设备 是 指 传输 速率 为 
每 秒 钟 几 个 字 节 到 数 百 个 字 节 的 设备 ， 典 型 的 设备 有 键盘 、 鼠 标 、 语 音 的 输入 等 。 中 速 设备 是 
指 传 输 速 率 在 每 秒 钟 数 千 个 字 节 到 数 十 千 个 字 节 的 设备 ， 典 型 的 设备 有 行 式 打印 机 、 激 光 打印 
机 等 。 高 速 设备 是 指 传输 速率 在 数 百 千 个 字 节 到 数 兆 字 节 的 设备 ， 典 型 的 设备 有 磁带 机 、 磁 盘 
机 和 光盘 机 等 。 


2， 设备 管理 的 目标 与 任务 


设备 管理 的 目标 主要 是 如 何 提高 设备 的 利用 率 ， 为 用 户 提供 方便 、 统 一 的 界面 。 提 高 设备 
的 利用 率 ， 就 是 提高 CPU 与 IO 设备 之 间 的 并 行 操作 程度 。 在 设备 管理 中 ， 主 要 利用 的 技术 有 
中 断 技术 、DMA 技术 、 通 道 技术 和 缓冲 技术 。 

设备 管理 的 任务 是 保证 在 多 道 程序 环境 下 ， 当 多 个 进程 竞争 使 用 设备 时 ， 按 一 定 的 策略 分 
配 和 管理 各 种 设备 ， 控 制 设备 的 各 种 操作 ， 完 成 IO 设备 与 主 存 之 间 的 数据 交换 。 

设备 管理 的 主要 功能 是 动态 地 掌握 并 记录 设备 的 状态 、 设 备 分 配 和 释放 、 缓 冲 区 管理 、 实 
现 物 理 IO 设备 的 操作 、 提 供 设备 使 用 的 用 户 接口 及 设备 的 访问 和 控制 。 


4.4.2 1O 软件 


设备 管理 软件 的 设计 水 平 决定 了 设备 管理 的 效率 。 从 事 IO 设备 管理 软件 的 结构 ， 其 基本 
思想 是 分 层 构造 ， 也 就 是 说 把 设备 管理 软件 组 织 成 为 一 系列 的 层次 。 其 中 ， 低 层 与 硬件 相关 ， 
它 把 硬件 与 较 高 层次 的 软件 隔离 开 来 ， 而 最 高 层 的 软件 则 向 应 用 提供 一 个 友好 的 、 清 晰 且 统一 
的 接口 。 
设计 IO 软件 的 主要 目标 是 设备 独立 性 和 统一 命名 。LO 软件 独立 于 设备 ， 就 可 以 提高 设 
备 管理 软件 的 设计 效率 。 当 输入 /输出 设备 更 新 时 ， 没 有 必要 重新 编写 全 部 设备 驱动 程序 。 用户 
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在 实际 应 用 中 也 可 以 看 到 ， 在 常用 操作 系统 中 ， 只 要 安装 了 相对 应 的 设备 驱动 程序 ， 就 可 以 很 
方便 地 安装 好 新 的 输入 /输出 设备 ， 甚 至 不 必 重 新 编译 就 能 将 设备 管理 程序 移 到 他 处 执行 。 
IO 设备 管理 软件 一 般 分 为 4 层 : 中 断 处 理 程序 、 设 备 驱 动 程序 、 与 设备 无 关 的 系统 软件 
和 用 户 级 软件 。 至 于 一 些 具体 分 层 时 细节 上 的 处 理 ， 是 依赖 于 系统 的 ， 没 有 严格 的 划分 ， 只 要 
有 利于 设备 独立 这 一 目标 ， 就 可 以 为 了 提高 效率 设计 不 同 的 层次 结构 。 
LO 软件 的 所 有 层次 及 每 一 层 的 主要 功能 如 图 4-26 所 示 。 
VO 请 求 层次 IO 应 答 VO 功能 

用 户 进程 【人 进行 IO 调用 、 格 式 化 JO 、Spooling 
设备 无 关 软 件 ”| | 命名 、 保护 、 阻塞 、 缓 钟 、 分 配 

h 

[1 


7 


设备 驱动 程序 置 设备 寄存 器 ; 检查 状态 
中 断 处 理 程序 当 IO 结束 时 唤醒 驱动 程序 
硬件 执行 IO 操作 


4-26 IO 系统 的 层次 结构 与 每 层 的 主要 功能 


图 4-26 中 的 箭头 给 出 了 IO 部 分 的 控制 流 。 这 里 举 一 个 读 硬盘 文件 的 例子 ， 当 用 户 程序 试 
图 读 一 个 硬盘 文件 时 ， 需 要 通过 操作 系统 实现 这 一 操作 。 与 设备 无 关 软 件 检查 高 速 缓存 中 有 无 
要 读 的 数据 块 ， 若 没有 ， 则 调用 设备 驱动 程序 ， 向 IO 硬件 发 出 一 个 请 求 。 然 后 ， 用 户 进程 阴 
塞 并 等 待 磁盘 操作 的 完成 。 当 磁盘 操作 完成 时 ， 硬 件 产生 一 个 中 断 ， 转 入 中 断 处 理 程序 。 中 断 
处 理 程序 检查 中 断 的 原因 ， 认 识 到 这 时 磁盘 读 取 操作 已 经 完成 ， 于 是 唤醒 用 户 进程 取 回 从 磁盘 
读 取 的 信息 ， 从 而 结束 此 次 VO 请 求 。 用 户 进程 在 得 到 了 所 需 的 硬盘 文件 内 容 之 后 ,继续 运行 。 


4.4.3 设备 管理 采用 的 相关 技术 

1. 通道 技术 

引入 通道 的 目的 是 使 数据 的 传输 独立 于 CPU， 使 CPU 从 烦琐 的 IO 工作 中 解脱 出 来 。 设 
置 通道 后 ，CPU 只 需 向 通道 发 出 IO 命令 ， 通 道 收 到 命令 后 ， 从 主 存 中 取出 本 次 IO 要 执行 的 
通道 程序 并 执行 ， 仅 当 通 道 完成 了 IO 任务 后 才 向 CPU 发 出 中 断 信 号 。 

根据 信息 交换 方式 的 不 同 , 将 通道 分 为 字 节 多 路 通道 、 数 组 选择 通道 和 数组 多 路 通道 三 类 。 

于 通道 价格 昂贵 ， 导 致 计算 机 系统 中 的 通道 数 是 有 限 的 ， 这 往往 会 成 为 输入 /输出 的 “瓶颈 ” 
问题 。 在 一 个 单 通路 的 IO 系统 中 ， 主 存 和 设备 之 间 只 有 一 条 通路 。 一 旦 某 通道 被 设备 占用 ， 
即使 另 一 通道 空闲 ， 连 接 该 通道 的 其 他 设备 也 只 有 等 待 。 解 决 “ 瓶 颈 ” 问 题 的 最 有 效 方法 是 增 
加 设备 到 主机 之 间 的 通路 ， 使 得 主 存 和 设备 之 间 有 两 条 以 上 的 通路 。 


五 
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2. DMA 技术 


直接 主 存 存 取 (Direct Memory Access，DMA) 是 指数 据 在 主 存 与 IO 设备 间 直 接 成 块 传 
送 ， 即 在 主 存 与 IO 设备 间 传 送 一 个 数据 块 的 过 程 中 不 需要 CPU 的 任何 干涉 ， 只 需要 CPU 在 
过 程 开始 启动 ( 即 向 设备 发 出 “传送 一 块 数据 ”的 命令 ) 与 过 程 结束 (CPU 通过 轮 询 或 中 断 得 
知 过 程 是 否 结束 和 下 次 操作 是 否 准备 就 绪 ) 时 的 处 理 ， 实 际 操作 由 DMA 硬件 直接 执行 完成 ， 
CPU 在 此 传送 过 程 中 可 做 别 的 事情 。 例 如 ， 在 非 DMA 时 ， 打 印 2048 字 节 至 少 需要 执行 2048 
次 输出 指令 ， 加 上 2048 次 中 断 处 理 的 代价 。 而 在 DMA 情况 下 ， 若 一 次 DMA 可 传送 512 个 字 
节 ， 则 只 需要 执行 4 次 输出 指令 和 处 理 4 次 打印 机 中 断 。 若 一 次 DMA 可 传送 字 节 数 大 于 等 于 
2048 个 字 节 ， 则 只 需要 执行 一 次 输出 指令 和 处 理 一 次 打印 机 中 断 。 


3， 缓冲 技术 


缓冲 技术 可 提高 外 设 利用 率 ， 尽 可 能 使 外 设 处 于 忙 状态 。 缓冲 技术 可 以 采用 硬件 缓冲 和 软 
件 缓冲 。 硬 件 缓冲 是 利用 专门 的 硬件 寄存 器 作为 缓冲 ， 软 件 缓冲 是 通过 操作 系统 来 管理 的 。 引 
入 缓冲 的 主要 原因 有 以 下 几 个 方面 。 

(1) 缓和 CPU 与 IO 设备 间 速 度 不 匹配 的 矛盾 。 

(2) 减少 对 CPU 的 中 断 频 率 ， 放 宽 对 中 断 响 应 时 间 的 限制 。 

(3) 提高 CPU 和 IO 设备 之 间 的 并 行 性 。 

在 所 有 的 IO 设备 与 处 理 机 〈 主 存 ) 之 间 都 使 用 了 缓冲 区 来 交换 数据 ， 所 以 操作 系统 必须 
组 织 和 管理 好 这 些 缓冲 区 。 缓 冲 可 分 为 单 缓冲 、 双 缓冲 、 多 缓冲 和 环形 缓冲 。 


4. Spooling 技术 


Spooling 是 Simultaneous Peripheral Operations On Line (外围 设 备 联机 操作 ) 的 简称 。 所谓 
Spooling 技术 ， 实 际 上 是 用 一 类 物理 设备 模拟 另 一 类 物理 设备 的 技术 ， 是 使 独占 使 用 的 设备 变 
成 多 台 虚 拟 设备 的 一 种 技术 ， 也 是 一 种 速度 匹配 技术 。 

Spooling 系统 是 由 “ 预 输入 程序 ”“ 缓 输出 程序 ”和 “ 井 管理 程序 ”以 及 输入 和 输出 井 组 
成 的 。 其 中 ， 输 入 井 和 输出 井 是 为 了 存放 从 输入 设备 输入 的 信息 以 及 作业 执行 的 结果 ， 系 统 在 
辅助 存储 器 上 开辟 的 存储 区 域 。Spooling 系统 的 组 成 和 结构 如 图 4-27 所 示 。 

Spooling 系统 的 工作 过 程 是 操作 系统 初 启 后 激活 Spooling 预 输入 程序 使 它 处 于 捕获 输入 请 
求 的 状态 ， 一 旦 有 输入 请 求 消息 ，Spooling 输入 程序 立即 得 到 执行 ， 把 装 在 输入 设备 上 的 作业 
输入 到 硬盘 的 输入 井中 并 填写 好 作业 表 ， 以 便 在 作业 执行 中 要 求 输入 信息 时 可 以 随时 找到 它们 
的 存放 位 置 。 当 作业 需要 输出 数据 时 , 可 以 先 将 数据 送 到 输出 井 , 当 输出 设备 空闲 时 , 由 Spooling 
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输出 程序 把 硬盘 上 输出 井 的 数据 送 到 慢 速 的 输出 设备 上 。 


作业 1 


[es 输出 设备 | || 组 输出 程序 


图 4-27 Spooling 系统 的 组 成 和 结构 


Spooling 系统 中 拥有 一 张 作 业 表 用 来 登记 进入 系统 的 所 有 作业 的 作业 名 、 状 态 和 预 输入 表 
位 置 等 信息 。 每 个 用 户 作业 拥有 一 张 预 输入 表 来 登记 该 作业 的 各 个 文件 的 情况 ， 包 括 设备 类 、 
信息 长 度 及 存放 位 置 等 。 输 入 井中 的 作业 有 如 下 4 种 状态 。 

(1) 提交 状态 。 作 业 的 信息 正 从 输入 设备 上 预 输入 。 

(2) 后 备 状 态 。 作 业 预 输入 结束 但 未 被 选中 执行 。 

(3) 执行 状态 。 作 业已 被 选中 运行 ， 在 运行 过 程 中 ， 它 可 从 输入 井中 读 取 数据 信息 ， 也 可 
向 输出 井 写 信息 。 

(4) 完成 状态 。 作 业已 经 撤离 ， 该 作业 的 执行 结果 等 待 组 输出 。 

【 例 4.14】 某 计算 机 系统 输入 /输出 采用 双 缓冲 工作 方式 ， 其 工作 过 程 如 下 图 所 示 ， 假 
设 磁盘 块 与 缓冲 区 大 小 相同 ,每 个 盘 块 读 入 缓冲 区 的 时 间 了 为 10ns， 缓 冲 区 送 用 户 区 的 时 
间 M 为 6hs， 系统 对 每 个 磁盘 块 数据 的 处 理 时 间 C 为 2hs。 若 用 户 需 要 将 大 小 为 10 个 磁盘 
块 的 Docl 文件 逐 块 从 磁盘 读 入 缓冲 区 ， 并 送 用 户 区 进行 处 理 ， 那 么 采用 双 组 冲 需要 花费 
的 时 间 为 _Q》 hs， 比 使 用 单 缓冲 节约 了 _〈2) hs 时 间 。 


用 户 进程 


(1) A. 100 B. 108 C. 162 D. 180 
(2) A.0 B.8 C. 54 D. 62 
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分 析 〈1): 本 小 题 的 正确 的 答案 为 B。 双 缓冲 的 工作 特点 是 可 以 实现 对 缓冲 区 中 数据 
的 输入 了 和 提取 M， 与 CPU 的 计算 C， 三 者 并 行 工 作 。 双 缓冲 的 工作 基本 工作 过 程 是 在 
设备 输入 时 ， 先 将 数据 输入 到 缓冲 区 1， 装 满 后 便 转 向 缓冲 区 2。 所 以 双 缓冲 进一步 加 快 了 
IO 的 速度 ， 提 高 了 设备 的 利用 率 。 在 双 缓冲 时 ， 系 统 处 理 一 块 数据 的 时 间 可 以 粗略 地 认 
为 是 Max(C， 刀 。 如 果 C<T7， 可 使 块 设备 连续 输入 ; 如 果 C>7， 则 可 使 系统 不 必 等待 设 备 
输入 。 本 题 每 一 块 数据 的 处 理 时 间 为 10， 采 用 双 缓 冲 需要 花费 的 时 间 为 10*10+6+2=108。 

分 析 〈2): 本 小 题 的 正确 的 答案 为 C。 采 用 单 缓冲 的 工作 过 程 如 图 4-28 所 示 。 

用 户 进程 
处 理 (C) 


传送 (M) 输入 (7) 


1/0 设 备 


图 4-28 单 缓冲 工作 过 程 图 


当 第 一 块 数据 送 入 用 户 工作 区 后 ， 缓 冲 区 是 空闲 的 可 以 传送 第 二 块 数 据 。 这 样 第 一 块 
数据 的 处 理 C1 与 第 二 块 数据 的 输入 72 是 可 以 并 行 的 ， 依 次 类 推 ， 如 图 4-29 所 示 。 


LM LM 一 。，。 Me, 
1 1 


= 
图 4-29 单 缓冲 并 行 工作 示意 图 

系统 对 每 一 块 数据 的 处 理 时 间 为 : Max(C，7)+M。 因为 ， 当 7>C 时 , 处 理 时 间 为 M+7; 
当 7<C 时 ， 处 理 时 间 为 M+C。 本 题 每 一 块 数据 的 处 理 时 间 为 10+6=16，Docl 文件 的 处 理 
时 间 为 16*10+2=162hs， 比 使 用 单 缓冲 节约 了 162 -108=54hs 时 间 。 
4.4.4 磁盘 调度 

磁盘 是 可 被 多 个 进程 共享 的 设备 。 当 有 多 个 进程 请 求 访问 磁盘 时 ， 为 了 保证 信息 的 安全 ， 
系统 在 每 一 时 刻 只 允许 一 个 进程 启动 磁盘 进行 IO 操作 ， 其 余 的 进程 只 能 等 待 。 因 此 ， 操 作 系 
统 应 采用 一 种 适当 的 调度 算法 ， 使 各 进程 对 磁盘 的 平均 访问 (主要 是 寻 道 ) 时 间 最 小 。 磁 盘 调 
度 分 为 移 辟 调度 和 旋转 调度 两 类 ， 并 且 是 先进 行 移 辟 调度 ， 然 后 进行 旋转 调度 。 由 于 访问 磁盘 
最 耗 时 的 是 寻 道 时 间 ， 因 此 ， 磁 盘 调 度 的 目标 是 使 磁盘 的 平均 寻 道 时 间 最 少 。 

1， 磁盘 驱动 调度 


常用 的 磁盘 调度 算法 如 下 。 
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(1) 先 来 先 服务 (First-Come First-Served，FCFS)。 这 是 最 简单 的 磁盘 调度 算法 ， 它 根据 
进程 请 求 访问 磁盘 的 先后 次 序 进行 调度 。 此 算法 的 优点 是 公平 、 简 单 ， 且 每 个 进程 的 请 求 都 能 
依次 得 到 处 理 ， 不 会 出 现 某 进程 的 请 求 长 期 得 不 到 满足 的 情况 。 但 此 算法 由 于 未 对 寻 道 进行 优 
化 ， 致 使 平均 寻 道 时 间 可 能 较 长 。 

(2) 最 短 寻 道 时 间 优 先 〈Shortest Seek Time First，SSTF)。 该 算法 选择 这 样 的 进程 ， 其 要 
求 访问 的 磁道 与 当前 磁头 所 在 的 磁道 距离 最 近 ， 使 得 每 次 的 寻 道 时间 最 短 。 但 这 种 调度 算法 不 
能 保证 平均 寻 道 时 间 最 短 。 
(3) 扫描 算法 (SCAN)。 扫 描 算 法 不 仅 考 虑 到 要 访问 的 磁道 与 当前 磁道 的 距离 ， 更 优先 考 
虑 的 是 磁头 的 当前 移动 方向 。 例 如 ， 当 磁头 正在 由 里 向 外 移动 时 ，SCAN 算法 所 选择 的 下 一 个 
访问 对 象 应 是 其 要 访问 的 磁道 既 在 当前 磁道 之 外 ， 又 是 距离 最 近 的 。 这 样 由 里 向 外 地 访问 ， 直 
到 再 无 更 外 的 磁道 需要 访问 时 才 将 磁 臂 换 向 ， 由 外 向 里 移动 。 这 时 ， 同 样 也 是 每 次 选择 在 当前 
磁道 之 内 ， 且 距离 最 近 的 进程 来 调度 。 这 样 ， 磁 头 逐 步 地 向 里 移动 ， 直 到 再 无 更 里 面 的 磁道 需 
要 访问 。 显 然 ， 这 种 方式 避免 了 饥饿 现象 的 出 现 。 在 这 种 算法 中 ， 磁 头 移动 的 规律 颇 似 电梯 的 
运行 ， 故 又 常 称 为 电梯 调度 算法 。 

(4) 单 向 扫描 调度 算法 (CSCAN)。SCAN 存在 这 样 的 问题 ， 当 磁头 刚 从 里 向 外 移动 过 某 
一 磁道 时 ， 恰 有 一 进程 请 求 访问 此 磁道 ， 这 时 该 进程 必须 等 待 ， 待 磁头 从 里 向 外 ， 再 从 外 向 里 
扫描 完 所 有 要 访问 的 磁道 后 才 处 理 该 进程 的 请 求 ， 致 使 该 进程 的 请 求 被 严重 地 推迟 。 为 了 减少 
这 种 延迟 ， 算 法 规定 磁头 只 做 单 向 移动 。 


2. 旋转 调度 算法 


当 移动 臂 定位 后 ， 有 多 个 进程 等 待 访问 该 柱 面 时 ， 应 当 如 何 决定 这 些 进程 的 访问 顺序 ? 这 
就 是 旋转 调度 要 考虑 的 问题 。 显然 , 系统 应 该 选择 延迟 时 间 最 短 的 进程 对 磁盘 的 扇 区 进行 访问 。 
当 有 若干 等 待 进程 请 求 访问 磁盘 上 的 信息 时 ， 旋 转调 度 应 考虑 如 下 情况 。 

(1) 进程 请 求 访问 的 是 同一 磁道 上 不 同 编号 的 扇 区 。 

(2) 进程 请 求 访问 的 是 不 同 磁 道上 不 同 编号 的 扇 区 。 

(3) 进程 请 求 访问 的 是 不 同 磁道 上 具有 相同 编号 的 扇 区 。 

对 于 (1) 和 〈2)， 旋 转调 度 总 是 让 首先 到 达 读 / 写 磁头 位 置 下 的 扇 区 先进 行 传送 操作 ;对 
于 〈3)， 旋 转调 度 可 以 任 选 一 个 读 / 写 磁 头 位 置 下 的 扇 区 进行 传送 操作 。 
【 例 4.15】 数据 存储 在 磁盘 上 的 排列 方式 会 影响 IO 服务 的 总 时 间 。 假 设 每 个 磁道 划分 成 
10 个 物理 块 ， 每 块 存放 1 个 逻辑 记录 。 风 辑 记 录 RI，R,，…，Rio 存 放 在 同一 个 磁道 上 ， 记 录 
的 安排 顺序 如 下 表 所 示 。 


物理 块 1 2 3 4 5 7 8 10 
逻辑 记录 Ri R, Rs Ra Rs Ry Rs R 


司 
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假定 磁盘 的 旋转 速度 为 每 周 20ms， 磁 头 当前 处 在 Ri 的 开始 处 。 若 系统 顺序 处 理 这 
些 记录 ， 使 用 单 缓冲 区 ， 每 个 记录 处 理 时 间 为 4ms， 则 处 理 这 10 个 记录 的 最 长 时 间 
为 _(1)〉 ; 对 信息 存储 进行 优化 分 布 后 ， 处 理 10 个 记录 的 最 少时 间 为 _ (2) 

(1) A. 180ms B. 200ms C. 204ms D. 220ms 

(2) A. 40ms B. 60ms C. 100ms D. 160ms 

空 (1) 分 析 : 系统 读 记录 的 时 间 为 20/10 二 2ms， 对 于 第 一 种 情况 ， 系 统 读 出 并 处 理 记录 
Ri 之 后 ， 人 磁头 已 转 到 记录 Rs 的 开始 处 ， 所 以 为 了 读 出 记录 R,， 磁 盘 必 须 再 转 一 圈 ， 需 要 2ms 
( 读 记 录 ) 加 20ms 转 一 圈 ) 的 时 间 。 这 样 ， 处 理 10 个 记录 的 总 时 间 应 为 处 理 前 9 个 记录 〔 即 
Ri1、R,、...、R) 的 总 时 间 再 加 上 读 Rio 和 处 理 时间 ， 即 9x22ms+ 6ms=204ms。 

室 〈2) 分 析 : 对 于 第 二 种 情况 ， 若 对 信息 进行 分 布 优化 的 结果 如 下 表 所 示 。 


Ea 
可 以 看 出 ， 当 读 出 记录 Ri 并 处 理 结束 后 ， 磁 头 刚好 转 至 尼 记录 的 开始 处 ， 立 即 就 可 以 读 


出 并 处 理 , 因此 处 理 10 个 记录 的 总 时 间 为 10x(2ms( 读 记录 )+4ms( 处 理 记 录 )) 王 10x6ms=60ms。 
【 例 4.16】 当 进 程 请 求 读 磁盘 时 ， 操 作 系统 _〈1) _。 假 设 磁 盘 的 每 个 磁道 有 10 个 扇 区 ， 
移动 臂 位 于 18 号 柱 面 上 ， 且 进程 的 请 求 序列 如 表 4-3 所 示 。 


表 4-3 进程 的 请 求 序列 


请 求 序列 柱 面 号 磁 头 号 扇 区 号 
(@ 15 8 9 
© 20 6 3 
加 20 9 6 
四 40 10 5 
© 15 4 
© 6 3 10 
@ 8 9 
15 10 4 


那么 ， 按 照 最 短 寻 道 时 间 优先 的 响应 序列 为 _(2) 
(1) A. 只 需要 进行 旋转 调度 ， 无 须 进行 移 臂 调度 
B. 旋转 、 移 臂 调 度 同 时 进行 
C. 先进 行 移 臂 调度 ， 再 进行 旋转 调度 
D. 先进 行 旋转 调度 ， 再 进行 移 辟 调度 
(2) A. GOVDYDO©® B. GAOOVDOO® 
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C. GVOOOOS D. VO 

分 析 : 空 (1) 的 正确 答案 为 C， 空 〈2) 的 正确 答案 为 A。 

当 进程 请 求 读 磁盘 时 ， 操 作 系统 先进 行 移 臂 调度 ， 再 进行 旋转 调度 。 由 于 移动 臂 位 于 18 
号 柱 面 上 , 按照 最 短 寻 道 时 间 优先 的 响应 柱 面 序列 为 20 一 15 一 8 一 6 一 40。 按照 旋转 调度 的 原则 : 
进程 在 20 号 柱 面 上 的 响应 序列 为 @ 一 @@， 因 为 进程 访问 的 是 不 同 磁道 上 的 不 同 编号 的 扇 区 ， 放 
转调 度 总 是 让 首先 到 达 读 / 写 磁 头 位 置 下 的 扇 区 先进 行 传送 操作 。 进 程 在 15 号 柱 面 上 的 响应 序 
列 为 加 一 中 一 @ 或 @ 一 四 一 回 . 对 于 @ 和 @ 可 以 任 选 一 个 进行 读 / 写 ,因为 进程 访问 的 是 不 同 磁 
道上 具有 相同 编号 的 扇 区 ， 旋 转调 度 可 以 任 选 一 个 读 / 写 磁头 位 置 下 的 扇 区 进行 传送 操作 。@ 在 
40 号 柱 面 上 。@ 在 6 号 柱 面 上 。Q@ 在 8 号 柱 面 上 。 


4.5 文件 管理 


如 果 没 有 文件 系统 用 户 要 访问 外 存储 器 上 的 信息 是 很 麻烦 的 ， 不 仅 要 考虑 信息 在 外 存储 器 
上 的 存放 位 置 ， 而 且 要 记 住 信息 在 外 存储 器 的 分 布 情况 ， 构 造 IO 程序 。 稍 不 注意 ， 就 会 破坏 
已 存放 的 信息 。 特 别 是 多 道 程 序 技术 出 现 后 ， 多 个 用 户 之 间 根 本 无 法 预料 各 个 不 同 程序 间 的 信 
息 在 外 存储 器 上 是 如 何 分 配 的 。 鉴 于 这 些 原因 , 引入 文件 系统 专门 负责 管理 外 存储 器 上 的 信息 ， 
而 这 些 信 息 是 以 文件 的 形式 存放 的 ， 使 用 户 可 以 “ 按 名 ”高 效 、 快 速 和 方便 地 存 取信 息 。 


4.5.1 基本 概念 
1. 文件 


文件 〈File) 是 具有 符号 名 的 、 在 逻辑 上 具有 完整 意义 的 一 组 相关 信息 项 的 集合 。 例 如 ， 
一 个 源 程序 、 一 个 目标 程序 、 编 译 程序 、 一 批 待 加 工 的 数据 和 各 种 文档 等 都 可 以 各 自 组 成 一 个 
文件 。 

信息 项 是 构成 文件 内 容 的 基本 单位 , 可 以 是 一 个 字符 , 也 可 以 是 一 个 记录 , 记录 可 以 等 长 ， 
也 可 以 不 等 长 。 一 个 文件 包括 文件 体 和 文件 说 明 。 文 件 体 是 文件 真实 的 内 容 。 文 件 说 明 是 操作 
系统 为 了 管理 文件 所 用 到 的 信息 ， 包 括 文件 名 、 文 件 内 部 标识 、 文 件 的 类 型 、 文 件 存储 地 址 、 
文件 的 长 度 、 访 问 权 限 、 建 立时 间 和 访问 时 间 等 。 
文件 是 一 种 抽象 机 制 ， 它 隐藏 了 硬件 和 实现 细节 ， 提 供 了 将 信息 保存 在 磁盘 上 而 且 便 于 以 
后 读 取 的 手段 ， 使 用 户 不 必 了 解 信息 存储 的 方法 、 位 置 以 及 存储 设备 实际 操作 方式 便 可 存 取信 
息 。 因 此 ,文件 管理 中 的 一 个 非常 关键 的 问题 在 于 文件 的 命名 。 文 件 名 是 在 进程 创建 文件 时 确 
定 的 ， 以 后 这 个 文件 将 独立 于 进程 存在 直到 它 被 显 式 删 除 。 当 其 他 进程 要 使 用 文件 时 必须 显 式 
指出 该 文件 名 ， 操 作 系 统 根据 文件 名 对 其 进行 控制 和 管理 。 不 同 的 操作 系统 ， 文 件 的 命名 规则 
有 所 不 同 ， 即 文件 名 字 的 格式 和 长 度 因 系统 而 异 。 
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2. 文件 系统 


由 于 计算 机 系统 处 理 的 信息 量 越 来 越 大 ， 所 以 不 可 能 将 所 有 的 信息 保存 到 主 存 中 。 特别 是 
在 多 用 户 系统 中 ， 既 要 保证 各 用 户 文件 存放 的 位 置 不 冲突 ， 又 要 防止 任 一 用 户 对 外 存储 器 〈 简 
称 外 存 ) 空间 占 而 不 用 ; 既 要 保证 各 用 户 文件 在 未 经 许可 的 情况 下 不 被 窃取 和 破坏 ， 又 要 允许 
在 特定 的 条 件 下 多 个 用 户 共享 某 些 文件 。 因 此 ， 需 要 设立 一 个 公共 的 信息 管理 机 制 来 负责 统一 
管理 外 存 和 外 存 上 的 文件 。 

所 谓 文件 管理 系统 ， 就 是 操作 系统 中 实现 文件 统一 管理 的 一 组 软件 和 相关 数据 的 集合 ， 
门 负责 管理 和 存 取 文 件 信息 的 软件 机 构 ， 简 称 文件 系统 。 文 件 系统 的 功能 包括 按 名 存 取 ， 即 用 
户 可 以 “ 按 名 存 取 ”， 而 不 是 “ 按 地 址 存 取 ”; 统一 的 用 户 接口 ， 在 不 同 设备 上 提供 同样 的 接口 ， 
方便 用 户 操作 和 编程 ， 并 发 访问 和 控制 ， 在 多 道 程序 系统 中 支持 对 文件 的 并 发 访问 和 控制 ， 安 
全 性 控制 ， 在 多 用 户 系 统 中 的 不 同 用 户 对 同一 文件 可 有 不 同 的 访问 权限 ， 优 化 性 能 ， 采 用 相关 
技术 提高 系统 对 文件 的 存储 效率 、 检 索 和 读 / 写 性 能 ， 差 错 恢复 ， 能 够 验证 文件 的 正确 性 ， 并 具 
有 一 定 的 差错 恢复 能 力 。 


3. 文件 的 类 型 


(1) 按 文件 性 质 和 用 途 可 将 文件 分 为 系统 文件 、 库 文件 和 用 户 文件 。 

(2) 按 信息 保存 期 限 分 类 可 将 文件 分 为 临时 文件 、 档 案 文件 和 永久 文件 。 

(3) 按 文件 的 保护 方式 分 类 可 将 文件 分 为 只 读 文件 、 读 / 写 文件 、 可 执行 文件 和 不 保护 文件 。 

(4) UNIX 系统 将 文件 分 为 普通 文件 、 目 录 文 件 和 设备 文件 〈 特 殊 文 件 )。 

目前 常用 的 文件 系统 类 型 有 FAT、Vfat、NTFS、Ext2 和 HPFS 等 。 

文件 分 类 的 目的 是 对 不 同文 件 进行 管理 ， 提 高 系统 效率 ， 提 高 用 户 界面 友好 性 。 当 然 ， 根 
据 文件 的 存 取 方法 和 物理 结构 的 不 同 还 可 以 将 文件 分 为 不 同 的 类 型 ， 这 将 在 文件 的 逻辑 结构 和 
文件 的 物理 结构 中 介绍 。 


4.5.2 ”文件 的 结构 和 组 织 


文件 的 结构 是 指 文件 的 组 织 形式 。 从 用 户 角 度 看 到 的 文件 组 织 形式 称 为 文件 的 逻辑 结构 ， 
文件 系统 的 用 户 只 要 知道 所 需 文 件 的 文件 名 就 可 以 存 取 文 件 中 的 信息 ， 而 无 须知 道 这 些 文件 究 
竞 存 放 在 什么 地 方 。 从 实现 的 角度 看 ， 文 件 在 文件 存储 器 上 的 存放 方式 称 为 文件 的 物理 结构 。 


1. 文件 的 逻辑 结构 


文件 的 逻辑 结构 可 分 为 两 大 类 : 一 是 有 结构 的 记录 式 文件 ， 它 是 由 一 个 以 上 的 记录 构成 的 
文件 ， 故 又 称 为 记录 式 文件 ， 二 是 无 结构 的 流 式 文件 ， 它 是 由 一 串 顺 序 字 符 流 构成 的 文件 。 


ls: 
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1) 有 结构 的 记录 式 文 件 

在 记录 式 文件 中 , 所 有 的 记录 通常 都 是 描述 一 个 实体 集 的 , 有 着 相同 或 不 同 数目 的 数据 项 ， 
记录 的 长 度 可 分 为 定 长 和 不 定 长 两 类 。 

(1) 定 长 记录 。 指 文件 中 所 有 记录 的 长 度 相同 。 所 有 记录 中 的 各 个 数据 项 都 处 在 记录 中 相 
同 的 位 置 ， 具 有 相同 的 顺序 及 相同 的 长 度 ， 文 件 的 长 度 用 记录 数目 表示 。 定 长 记录 的 特点 是 处 
理 方便 ， 开 销 小 ， 它 是 目前 较 常 用 的 一 种 记录 格式 ， 被 广泛 用 于 数据 处 理 中 。 

(2) 变 长 记录 。 指 文件 中 各 记录 的 长 度 不 相同 。 这 是 因为 : 一 个 记录 中 所 包含 的 数据 项 数目 
可 能 不 同 ， 如 书 的 著作 者 、 论 文中 的 关键 词 ; 数据 项 本 身 的 长 度 不 定 ， 如 病历 记录 中 的 病因 、 病 
史 ， 科 技 情报 记录 中 的 摘要 等 。 但 是 ， 不 论 是 哪 一 种 结构 ， 在 处 理 前 每 个 记录 的 长 度 是 可 知 的 。 

2) 无 结构 的 流 式 文件 

文件 体 为 字 节 流 ， 不 划分 记录 。 无 结构 的 流 式 文件 通常 采用 顺序 访问 方式 ， 并 且 每 次 读 / 
写 访问 可 以 指定 任意 数据 长 度 ， 其 长 度 以 字 节 为 单位 。 对 于 流 式 文件 访问 ， 是 利用 读 / 写 指针 指 
出 下 一 个 要 访问 的 字符 。 可 以 把 流 式 文件 看 作 是 记录 式 文件 的 一 个 特例 。 在 UNIX 系统 中 ， 所 
有 的 文件 都 被 看 作 是 流 式 文件 ， 即 使 是 有 结构 的 文件 ， 也 被 视 为 流 式 文件 ， 系 统 不 对 文件 进行 
格式 处 理 。 


2. 文件 的 物理 结构 


文件 的 物理 结构 是 指 文件 的 内 部 组 织 形式 ， 即 文件 在 物理 存储 设备 上 的 存放 方法 。 由 于 文 
件 的 物理 结构 决定 了 文件 在 存储 设备 上 的 存放 位 置 ， 所 以 文件 的 逻辑 块 号 到 物理 块 号 的 转换 也 
是 由 文件 的 物理 结构 决定 的 。 根 据 用 户 和 系统 管理 上 的 需要 ， 可 采用 多 种 方法 来 组 织 文件 ， 下 
面 介绍 几 种 常见 的 文件 物理 结构 。 

(1) 连续 结构 。 连 续 结构 也 称 顺序 结构 ， 它 将 逻辑 上 连续 的 文件 信息 (如 记录 ) 依次 存放 
在 连续 编号 的 物理 块 上 。 只 要 知道 文件 的 起 始 物 理 块 号 和 文件 的 长 度 ， 就 可 以 很 方便 地 进行 文 
件 的 存 取 。 

对 文件 诸 记 录 进 行 批量 存 取 时 ， 连 续 结构 在 所 有 逻辑 文件 中 的 存 取 效 率 是 最 高 的 。 但 在 交 
互 应 用 的 场合 ， 如 果 用 户 程 序 ) 要 求 随机 地 查找 或 修改 单个 记录 ， 此 时 系统 需要 逐个 地 查找 
各 个 记录 ， 这 样 采用 连续 结构 所 表现 出 来 的 性 能 就 可 能 很 差 ， 尤 其 是 当 文 件 较 大 时 情况 更 为 严 
重 。 连 续 结构 的 另 一 个 缺点 是 不 便于 记录 的 增加 或 删除 操作 。 为 了 解决 这 个 问题 ， 可 以 为 采用 
连续 结构 的 文件 配置 一 个 运行 记录 文件 (Log File) 或 称 为 事务 文件 〈Transactor File)， 规 定 每 
隔 一 定时 间 ， 例 如 4 小 时 ， 将 运行 记录 文件 与 原来 的 主 文件 进行 合并 , 产生 一 个 新 文件 。 这 样 ， 
不 必 每 次 对 记录 进行 增加 或 删除 操作 ， 物 理 移动 磁盘 信息 ， 使 其 成 为 连续 结构 。 


图 18 荐 。 数据 库 系统 工程 师 教程 第 3 版 ) 


(2) 链接 结构 。 链 接 结构 也 称 串 联结 构 ， 它 是 将 逻辑 上 连续 的 文件 信息 《如 记录 ) 存放 在 
不 连续 的 物理 块 上 ， 每 个 物理 块 设 有 一 个 指针 指向 下 一 个 物理 块 。 因 此 ， 只 要 知道 文件 的 第 一 
个 物理 块 号 ， 就 可 以 按 链 指针 查找 整个 文件 。 
(3) 索引 结构 。 在 采用 索引 结构 时 ， 将 逻辑 上 连续 的 文件 信息 《如 记录 ) 存放 在 不 连续 的 
物理 块 中 ， 系 统 为 每 个 文件 建立 一 张 索 引 表 。 索 引 表 记 录 了 文件 信息 所 在 的 逻辑 块 号 对 应 的 物 
理 块 号 ， 并 将 索引 表 的 起 始 地 址 放 在 与 文件 对 应 的 文件 目录 项 中 。 
(4) 多 个 物理 块 的 索引 表 。 索 引 表 是 在 文件 创建 时 由 系统 自动 建立 的 ， 并 与 文件 一 起 存放 
在 同一 文件 卷 上 。 根 据 一 个 文件 大 小 的 不 同 ， 其 索引 表 占 用 物理 块 的 个 数 不 等 ， 一 般 占 一 个 或 
几 个 物理 块 。 多 个 物理 块 的 索引 表 可 以 有 两 种 组 织 方式 : 链接 文件 和 多 重 索 引 方式 。 

在 UNIX 文件 系统 中 采用 的 是 三 级 索引 结构 ， 在 文件 系统 中 inode 是 基本 的 构件 ， 它 表示 
文件 系统 树 型 结构 的 节点 。UNIX 文件 索引 表 项 分 4 种 寻 址 方式 : 直接 寻 址 、 一 级 间接 寻 址 、 
二 级 间接 寻 址 和 三 级 间接 寻 址 。 


4.5.3 文件 目录 


为 了 实现 “ 按 名 存 取 ”， 系 统 必 须 为 每 个 文件 设置 用 于 描述 和 控制 文件 的 数据 结构 ， 它 至 
少 要 包括 文件 名 和 存放 文件 的 物理 地 址 ， 这 个 数据 结构 称 为 文件 控制 块 (FCB), 文件 控制 块 的 
有 序 集合 称 为 文件 目录 。 换 句 话 说， 文件 目录 是 由 文件 控制 块 组 成 的 ， 专 门 用 于 文件 的 检索 。 
文件 控制 块 也 称 为 文件 的 说 明 或 文件 目录 项 〈 简 称 目录 项 )。 


1. 文件 控制 块 


文件 控制 块 中 包含 以 下 三 类 信息 : 基本 信息 类 、 存 取 控 制 信息 类 和 使 用 信息 类 。 

(1) 基本 信息 类 。 例 如 文件 名 、 文 件 的 物理 地 址 、 文 件 长 度 和 文件 块 数 等 。 

(2) 存 取 控 制 信息 类 。 文 件 的 存 取 权限 ， 像 UNIX 用 户 分 成 文件 主 、 同 组 用 户 和 一 般 用 户 
三 类 ， 这 三 类 用 户 的 读 / 写 执行 RWX 权限 。 

(3) 使 用 信息 类 。 文 件 建立 日 期 、 最 后 一 次 修改 日 期 、 最 后 一 次 访问 的 日 期 、 当 前 使 用 的 
信息 〈 如 打开 文件 的 进程 数 、 在 文件 上 的 等 待 队列 ) 等 。 


2， 目 录 结 构 


文件 目录 结构 的 组 织 方式 直接 影响 到 文件 的 存 取 速 度 ， 关 系 到 文件 的 共享 性 和 安全 性 ， 因 
此 组 织 好 文件 的 目录 是 设计 文件 系统 的 重要 环节 。 常 见 的 目录 结构 有 3 种 : 一 级 目录 结构 、 二 
级 目录 结构 和 多 级 目录 结构 。 

(1) 一 级 目录 结构 。 一 级 目录 的 整个 目录 组 织 是 一 个 线性 结构 ， 在 整个 系统 中 只 需 建立 一 
张 目录 表 ， 系 统 为 每 个 文件 分 配 一 个 目录 项 。 一 级 目录 结构 简单 ， 缺 点 是 查找 速度 慢 ， 不 允许 


ph 
tn 
RN 
En 


户 的 文件 时 ， 这 种 隔离 便 成 为 一 个 缺点 ， 


不 便于 实现 文件 共享 等 ， 因 


构 是 
成 的 。 在 主 文件 目录 中 ， 每 个 用 
该 


此 它 主要 用 在 单 用 户 环境 中 。 
(2) 二 级 目录 结构 。 为 了 克服 一 级 目录 结构 存在 的 缺点 引入 了 二 级 目录 结构 ， 二 级 目录 结 
主 文件 目录 (Master File Directory，MFD) 和 用 户 目录 (User File Directory，UFD) 组 
户 文件 目录 都 占有 一 个 目录 项 ， 其 目录 项 中 包括 用 户 名 和 指向 
户 目录 文件 的 指针 。 用 户 目 录 是 由 用 户 所 有 文件 的 目录 项 组 成 的 。 
二 级 目录 结构 的 优点 是 提高 了 检索 目录 的 速度 ， 较 好 地 解决 了 重 名 问题 。 但 该 结构 也 存在 
一 些 问 题 ， 尽 管 能 有 效 地 将 多 个 用 户 隔离 开 〈 这 种 隔离 在 各 个 用 户 之 间 完 全 无 关 时 是 一 个 优 
点 )， 但 当 多 个 用 户 之 间 要 相互 合作 去 共同 完成 一 个 大 任务 ， 且 一 个 用 户 又 需要 去 访问 其 他 用 
因为 这 种 隔离 使 诸 用 户 之 间 不 便于 共享 文件 。 

(3) 多 级 目录 结构 。 为 了 解决 以 上 问题 ， 在 多 道 程序 设计 系统 中 常 采用 多 级 目录 结构 ， 这 
种 目录 结构 像 一 棵 倒置 的 有 根 树 ， 所 以 也 称 为 树 型 目录 结构 。 从 树 根 向 下 ， 每 一 个 节点 是 一 个 
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目录 ， 叶 节点 是 文件 。MS-DOS 和 UNIX 等 操作 系统 均 采 用 多 级 目录 结构 。 

在 采用 多 级 目录 结构 的 文件 系统 中 ， 用 户 要 访问 一 个 文件 ， 必 须 指 出 文件 所 在 的 路 径 名 ， 
路 径 名 是 从 根 目 录 开 始 到 该 文件 的 通路 上 所 有 各 级 目录 名 拼 起 来 得 到 的 。 在 各 目录 名 之 间 、 目 
录 名 与 文件 名 之 间 需 要 用 分 隔 符 隔 开 。 例 如 ， 在 MS-DOS 中 分 隔 符 为 “\”， 在 UNIX 中 分 隔 符 
为 “/”。 绝 对 路 径 名 〈Absolute Path Name) 是 指 从 根 目 录 “/” 开 始 的 完整 文件 名 ， 即 它 是 由 从 
根 目录 开始 的 所 有 目录 名 以 及 文件 名 构成 的 。 


【 例 4.17】 若 某 文件 系统 的 目录 结构 如 下 图 所 示 ， 假 设 用 户 要 访问 文件 fljava， 且 当前 工 
作 目 录 为 Program， 则 该 文件 的 全 文件 名 为 _(1) 
(1) A. fljava 


C. D:\Program\Java-prog\fl.java 


(2) A. Java-prog\ 


C. Program\Java-prog 


com2.dll 


， 其 相对 路 径 为 (2》 


B. \Document\Java-prog\fl .java 
D. \Program\Java-prog\fl .java 
B. \Java-prog\ 

D. \Program\Java-prog\ 


p| \ | 


Program 


Document 


C-prog Java-prog 


Wang 


fl.c fc fljava f2java 


txt 


myl.doc my2.doc 
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分 析 : 空 (1) 正确 的 选项 为 C。 因 为 ， 文 件 的 全 文件 名 应 包括 盘 符 及 从 根 目 录 开 始 的 路 
径 名 ， 所 以 从 题 图 可 以 看 出 文件 fljava 的 全 文件 名 为 D:\Program\Java-prog\fl.java。 空 (2) 下 
确 的 选项 为 A。 因 为 ， 文 件 的 相对 路 径 是 从 当前 工作 目录 下 的 路 径 名 ， 所 以 从 题 图 可 以 看 出 文 
件 fljava 的 相对 路 径 名 为 Java-prog\。 

4.5.4 ” 存 取 方法 和 存储 空间 的 管理 

1. 文件 的 存 取 方法 

文件 的 存 取 方 法 是 指 读 / 写 文件 存储 器 上 的 一 个 物理 块 的 方法 ,通常 有 顺序 存 取 和 随机 存 取 
两 种 方法 。 顺序 存 取 方 法 是 指 对 文件 中 的 信息 按 顺序 依次 进行 读 / 写 ; 随机 存 取 方法 是 指 对 文件 
中 的 信息 可 以 按 任 意 的 次 序 随机 地 读 / 写 。 

2. 文件 存储 空间 的 管理 


要 将 文件 保存 到 外 部 存储 器 (简称 外 存 或 辅 存 ) 上 首先 必须 知道 存储 空间 的 使 用 情况 ， 即 归 
些 物理 块 是 被 “占用 ”， 哪 些 是 “空闲 ”。 特 别 是 对 大 容量 的 磁盘 存储 空间 被 多 用 户 共享 时 ， 
户 执行 程序 经 常 要 在 磁盘 上 存储 文件 和 删除 文件 ， 根 本 无 法 人 工 记忆 磁盘 存储 空间 的 使 用 情况 ， 
故 采用 文件 系统 对 磁盘 空间 进行 管理 。 外 存 空闲 空 间 管理 的 数据 结构 通常 称 为 磁盘 分 配 表 (Disk 
Allocation Table)。 常 用 的 空闲 空间 的 管理 方法 有 位 示 图 、 空 闲 区 表 和 空闲 块 链 3 种 。 

(1) 空闲 区 表 。 将 外 存 空间 上 的 一 个 连续 的 未 分 配 区 域 称 为 “空闲 区 ”。 操 作 系统 为 磁盘 
外 存 上 的 所 有 空闲 区 建立 一 张 空闲 表 ， 每 个 表 项 对 应 一 个 空闲 区 ， 空 闲 表 中 包含 序号 、 空 闲 区 
的 第 一 块 号 、 空 闲 块 的 块 数 和 状态 等 信息 ， 如 表 4-4 所 示 。 它 适用 于 连续 文件 结构 。 


表 4-4 空闲 区 表 
序 号 空闲 块 数 状 态 
1 5 可 
2 8 可 
名 19 可 
4 攻 未 


(2) 位 示 图 。 这 种 方法 是 在 外 存 上 建立 一 张 位 示 图 (Bitmap)， 记 录 文 件 存储 器 的 使 用 情 
况 。 每 一 位 对 应 文件 存储 器 上 的 一 个 物理 块 ， 取 值 0 和 1 分 别 表 示 空 闲 和 占用 。 例 如 ， 某 文件 
存储 器 上 位 示 图 的 大 小 为 几 物理 块 依次 编号 为 0，1，2，…。 假 如 计算 机 系统 中 字 长 为 32 位 ， 
那么 在 位 示 图 中 的 第 0 个 字 〈 逻 辑 编 号 ) 对 应 文件 存储 器 上 的 0，1，2，…，31 号 物理 块 ; 第 
1 个 字 对 应 文件 存储 器 上 的 32，33，34，…，63 号 物理 块 ， 以 此 类 推 ， 如 图 4-30 所 示 。 
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第 0 字 
第 1 字 
第 2 字 
第 3 字 


第 n-l 字 or or Ty oO Ll 


图 4-30 ”位 示 图 例 

这 种 方法 的 主要 特点 是 位 示 图 的 大 小 由 磁盘 空间 的 大 小 (物理 块 总 数 ) 决定 ， 位 示 图 的 描 
述 能 力 强 ， 适 合 各 种 物理 结构 。 

(3) 空闲 块 链 。 每 个 空闲 物 理 块 中 有 指向 下 一 个 空闲 物理 块 的 指针 ， 所 有 空闲 物理 块 构成 
一 个 链表 ， 链 表 的 头 指 针 放 在 文件 存储 器 的 特定 位 置 上 《〈 如 管理 块 中 )， 不 需要 磁盘 分 配 表 ， 
节省 空间 。 每 次 申请 空闲 物理 块 只 需 根据 链表 的 头 指针 取出 第 一 个 空闲 物理 块 ， 根 据 第 一 个 空 
闲 物理 块 的 指针 可 找到 第 二 个 空闲 物理 块 ， 以 此 类 推 。 

(4) 成 组 链接 法 。UNIX 系统 采用 该 方法 。 例 如 ， 在 实现 时 系统 将 空闲 块 分 成 若干 组 ， 每 
100 个 空闲 块 为 一 组 ， 每 组 的 第 一 个 空闲 块 登记 了 下 一 组 空闲 块 的 物理 盘 块 号 和 空闲 块 总 数 。 
限 如 某 个 组 的 第 一 个 空闲 块 号 等 于 0， 意味 着 该 组 是 最 后 一 组 ， 无 下 一 组 空闲 块 。 
【 例 4.18】 某 文件 管理 系统 在 磁盘 上 建立 了 位 示 图 (Bitmap)， 记 录 磁 盘 的 使 用 情况 。 若 
系统 的 字 长 为 32 位 ， 磁 盘 上 的 物理 块 依次 编号 为 : 0、1、2、…， 那 么 4096 号 物理 块 的 使 
日 情况 在 位 示 图 中 的 第 _Q) 个 字 中 描述 ; 若 磁 盘 的 容量 为 200GB, 物理 块 的 大 小 为 1MB， 
b 么 位 示 图 的 大 小 为 _(2)〉 个 字 。 

(1) A. 129 B. 257 C. 513 D. 1025 

(2) A. 600 B. 1200 C. 3200 D. 6400 

分 析 : 空 (1) 的 正确 答案 是 A。 根 据 题 意 : 系统 的 字 长 为 32 位 ， 可 记录 32 个 物理 块 的 
使 用 情况 , 这样 0 一 31 号 物理 块 的 使 用 情况 在 位 示 图 中 的 第 1 个 字 中 描述 ，32 一 63 号 物理 块 的 
使 用 情况 在 位 示 图 中 的 第 2 个 字 中 描述 ，…… ，4064 一 4095 号 物理 块 的 使 用 情况 在 位 示 图 中 的 
第 128 个 字 中 描述 ，4096 一 4127 号 物理 块 的 使 用 情况 在 位 示 图 中 的 第 129 个 字 中 描述 。 空 (2) 
的 正确 答案 是 D。 由 于 磁盘 的 容量 为 200GB, 物理 块 的 大 小 为 1MB, 而 磁盘 有 200*1024=204 800 
个 物理 块 ， 故 位 示 图 的 大 小 为 204 800/32=6400 个 字 。 


4.5.5 ”文件 的 使 用 


文件 系统 将 用 户 的 逻辑 文件 按 一 定 的 组 织 方式 转换 成 物理 文件 存放 到 文件 存储 器 上 ,也 就 
是 说 , 文件 系统 为 每 个 文件 与 该 文件 在 磁盘 上 的 存放 位 置 建立 了 对 应 关系 。 当 用 户 使 用 文件 时 ， 
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文件 系统 通过 用 户 给 出 的 文件 名 查 出 对 应 文件 的 存放 位 置 , 读 出 文件 的 内 容 。 在 多 用 户 环境 下 ， 
为 了 文件 安全 和 保护 起 见 ， 操 作 系 统 为 每 个 文件 建立 和 维护 关于 文件 主 、 访 问 权限 等 方面 的 信 
息 。 为 此 ,操作 系统 在 操作 级 命令 级 ) 和 编程 级 (系统 调用 和 函数 ) 向 用 户 提供 文件 的 服务 。 

操作 系统 在 操作 级 向 用 户 提供 的 命令 有 目录 管理 类 命令 、 文 件 操作 类 命令 (如 复制 、 删 除 
和 修改 ) 和 文件 管理 类 命令 (如 设置 文件 权限 ) 等 。 


4.5.6 ”文件 的 共享 和 保护 


1. 文件 的 共享 


文件 共享 是 指 不 同 用 户 进程 使 用 同一 文件 ， 它 不 仅 是 不 同 用 户 完 成 同一 任务 所 必需 的 功 
能 ， 还 可 以 节省 大 量 的 主 存 空间 ， 减 少 由 于 文件 复制 而 增加 的 访问 外 存 的 次 数 。 文 件 共 享有 多 
种 形式 ， 采 用 文件 名 和 文件 说 明 分 离 的 目录 结构 有 利于 实现 文件 共享 。 

常见 的 文件 链接 有 硬 链 接 和 符号 链接 两 种 。 

(1) 硬 链接 。 文 件 的 硬 链 接 是 指 两 个 文件 目录 表 目 指向 同一 个 索引 节点 的 链接 ， 该 链接 也 
称 基于 索引 节点 的 链接 。 换 句 话说 ， 硬 链接 是 指 不 同文 件 名 与 同一 个 文件 实体 的 链接 。 文 件 硬 
链接 不 利于 文件 主 删除 它 拥有 的 文件 , 因为 文件 主要 删除 它 拥 有 的 共享 文件 , 必须 首先 删除 ( 关 
闭 ) 所 有 的 硬 链 接 ， 和 否则 就 会 造成 共享 该 文件 的 用 户 的 目录 表 目 指针 悬空 。 

例如 ，UNIX 系统 中 的 In 命令 ， 可 以 将 多 个 文件 名 与 一 个 文件 体 建立 链接 ， 其 格式 为 


in 文件 名 新 文件 名 或 in 文件 名 目录 名 


ls 命令 放 在 /bin 子 目 录 下 ， 可 在 /usrbin 子 目录 下 设置 一 个 DOS 兼容 的 命令 dir， 执 行 该 命 
令 相 当 于 执行 ls 命令 。 使 用 命令 In 可 以 给 一 个 已 存在 文件 增加 一 个 新 文件 名 , 即 文件 链接 数 增 
加 1， 此 种 链接 是 不 能 跨越 文件 系统 的 。 为 了 共享 文件 ， 只 是 在 两 个 不 同 子 目 录 下 取 了 不 同 的 
文件 名 ls 和 dir, 但 它们 具有 相同 的 索引 节点 。UNIX 这 种 文件 的 结构 称 为 树 形 带 勾 链 的 目录 结 
构 。 在 文件 的 索引 节点 中 ，di_nlink 变量 表示 链接 到 该 索引 节点 上 的 链接 数 ， 在 用 命令 ls -1 长 
列表 显示 时 ， 文 件 的 第 2 项 数据 项 表示 链接 数 。 

(2) 符号 链接 。 符 号 链接 建立 新 的 文件 或 目录 ， 并 与 原来 文件 或 目录 的 路 径 名 进行 映射 ， 
当 访 问 一 个 符号 链接 时 ， 系 统 通过 该 映射 找到 原文 件 的 路 径 ， 并 对 其 进行 访问 。 

例如 ，UNIX 系统 中 的 mn -s 命令 建立 符号 链接 。 此 时 ， 系 统 为 共享 的 用 户 创建 一 个 link 类 
型 的 新 文件 , 将 这 新 文件 登录 在 该 用 户 共享 目录 项 中 , 这 个 link 型 文件 包含 链接 文件 的 路 径 名 。 
该 类 文件 在 用 ls 命令 长 列表 显示 时 ， 文 件 链接 数 为 1。 

符号 链接 的 优点 是 可 以 跨越 文件 系统 ， 甚 至 可 以 通过 计算 机 网 络 连 接 到 世界 上 任何 地 方 的 
机 器 中 的 文件 ， 此 时 只 需 提供 该 文件 所 在 的 地 址 以 及 在 该 机 器 中 的 文件 路 径 。 
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符号 链接 的 缺点 是 其 他 用 户 读 取 符 号 链接 的 共享 文件 比 读 取 硬 链接 的 共享 文件 需要 增加 
读 盘 操作 的 次 数 。 因 为 其 他 用 户 去 读 符号 链接 的 共享 文件 时 ， 系 统 中 根据 给 定 的 文件 路 径 名 逐 
个 分 量 地 去 查找 目录 ， 通 过 多 次 读 盘 操作 才能 找到 该 文件 的 索引 节点 ， 而 用 硬 链接 的 共享 文件 
的 目录 文件 表 目 中 已 包括 了 共享 文件 的 索引 节点 号 。 


2. 文件 的 保护 


文件 系统 对 文件 的 保护 常 采用 存 取 控制 方式 进行 。 所 谓 存 取 控制 ， 就 是 不 同 的 用 户 对 文件 
的 访问 规定 不 同 的 权限 ， 以 防止 文件 被 未 经 文件 主 同意 的 用 户 访问 。 

(1) 存 取 控 制 矩 阵 。 理 论 上 ， 存 取 控制 方法 可 用 存 取 控制 矩阵 ， 它 是 一 个 二 维和 矩阵 ， 一 维 
列 出 计算 机 的 全 部 用 户 ， 另 一 维 列 出 系统 中 的 全 部 文件 ， 和 矩阵 中 的 每 个 元 素 4 表示 第 i 个 用 户 
对 第 7 个 文件 的 存 取 权 限 。 通 常 ， 存 取 权限 有 可 读 R、 可 写 W、 可 执行 X 以 及 它们 的 组 合 ， 如 
表 4-5 所 示 。 存 取 控制 矩阵 在 概念 上 是 简单 、 清 楚 的 ， 但 在 实现 上 却 有 困难 。 当 一 个 系统 用 户 
数 和 文件 数 很 大 时 ， 二 维和 矩阵 要 占 很 大 的 存储 空间 ， 验 证 过 程 也 将 耗费 许多 系统 时 间 。 


表 4-5 存 取 控制 矩阵 


ALPHA BETA REPORT SQRT 


(2) 存 取 控制 表 。 存 取 控 制 矩 阵 由 于 太 大 往往 无 法 实现 。 一 个 改进 的 办 法 是 按 用 户 对 文件 
的 访问 权力 的 差别 对 用 户 进行 分 类 ， 由 于 某 一 文件 往往 只 与 少数 几 个 用 户 有 关 ， 所 以 这 种 分 类 
方法 可 使 存 取 控 制 表 大 大 简化 。 

UNIX 系统 就 是 使 用 了 这 种 存 取 控 制 表 方 法 。 它 把 用 户 分 成 三 类 : 文件 主 、 同 组 用 户 和 其 
他 用 户 ， 每 类 用 户 的 存 取 权 限 为 可 读 、 可 写 、 可 执行 以 及 它们 的 组 合 。 在 用 ls 长 列表 显示 时 ， 
每 组 存 取 权限 用 3 个 字母 R、W、X 表示 ， 如 果 读 、 写 和 执行 中 哪 一 样 存 取 都 不 允许 ， 则 用 “-” 
字符 表示 。 用 ls -1 长 列表 显示 1 文件 如 下 : 


-rxr-xrt 1 bin bin 43296 May 13 1997 /opUK/SCO/Unix/5.0.4Eb/bin/ls 
显示 前 2 一 10 共 9 个 字符 表示 文件 的 存 取 权限 ， 每 3 个 字符 为 一 组 ， 分 别 表 示 文 件 主 、 同 


组 用 户 和 其 他 用 户 的 存 取 权 限 。 由 于 存 取 控制 表 对 每 个 文件 按 用 户 分 类 ， 所 以 该 存 取 控 制 表 可 
存放 在 每 个 文件 的 文件 控制 块 中 ,对 UNIX 只 需 9 位 二 进 制 来 表示 三 类 用 户 对 文件 的 存 取 权 限 ， 
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该 权限 存在 文件 索引 节点 的 di_mode 中 。 


(3) 用 户 权限 表 。 改 进 存 取 控 制 矩阵 的 另 一 种 方法 是 以 用 户 或 用 户 组 为 单位 将 用 户 可 


存 取 


的 文件 集中 起 来 存 入 表 中 ， 这 称 为 用 户 权 限 表 。 表 中 的 每 个 表 目 表示 该 用 户 对 应 文件 的 存 取 权 
限 ， 这 相当 于 存 取 控制 矩阵 一 行 的 简化 。 


(4) 密码 。 在 创建 文件 时 ， 由 用 户 提供 一 个 密码 ， 在 文件 存 入 磁盘 时 用 该 密码 对 文件 


加 密 。 在 进行 读 取 操 作 时 ， 要 对 文件 进行 解密 ， 只 有 知道 密码 的 用 户 才能 读 取 文件 。 
4.5.7 ”系统 的 安全 与 可 靠 性 


1 系统 的 安全 


内 容 


系统 的 安全 涉及 两 类 不 同 的 问题 ， 一 类 涉及 技术 、 管 理 、 法 律 、 道 德 和 政治 等 问题 ， 男 一 


类 涉及 操作 系统 的 安全 机 制 。 随 着 计算 机 应 用 范 目 


别 上 来 保证 系统 的 安全 性 。 一 般 从 4 个 级 别 上 对 文件 进行 安全 性 管理 : 系统 级 、 用 户 级 、 


级 和 文件 级 。 


(1) 系统 级 。 系 统 级 安全 管理 的 主要 任务 是 不 允许 未 经 授权 的 用 户 进入 系统 ， 从 而 也 


了 他 人 非法 使 用 系统 中 


(2) 用 户 级 。 用 户 级 安全 管理 是 通过 对 所 有 用 户 分 类 和 对 指定 用 户 分 配 访问 权 ， 不同 
户 对 不 同文 件 设置 不 同 的 存 取 权限 来 实现 。 例 如 ， 在 UNIX 系统 中 将 用 户 分 为 文件 主 、 组 
和 其 他 用 户 。 有 的 系统 将 用 户 分 为 超级 用 户 、 系 统 操作 员 和 一 般 用 户 。 

(3) 目录 级 。 目 录 级 安全 管理 是 为 了 保护 系统 中 各 种 目录 而 设计 的 ， 它 与 


h 各 类 资源 (包括 文件 )。 系 统 级 管理 的 3 


E 要 措施 有 注册 与 登录 。 


为 了 保证 目录 的 安全 ， 规 定 只 有 系统 核心 才 具 有 写 目 录 的 权利 。 
(4) 文件 级 。 文 件 级 安全 管理 是 通过 系统 管理 员 或 文件 主 
文件 的 访问 。 通 常 可 设置 以 下 几 种 属性 : 只 执行 、 隐 含 、 只 读 、 读 / 写 、 共 享 、 系 统 。 用 户 


件 的 访问 ， 将 由 用 户 访问 权 、 目 录 访 问 权 限 及 文件 属性 三 者 的 权限 所 确定 ， 或 者 说 是 有 效 权 限 
和 文件 属性 的 交集 。 例 如 对 于 
行 修改 、 更 名 和 删除 。 对 于 一 个 非 共享 文件 ,将 禁止 在 同一 时 间 内 


2. 文件 系统 的 可 靠 性 
文件 系统 的 可 靠 性 是 指 系 统 抵抗 和 预防 各 种 物理 性 破坏 和 人 为 性 破坏 的 能 力 。 比 起 计算 机 


的 损坏 ， 文 件 系统 破坏 往往 后 果 更 加 严重 。 例 如 ， 将 开水 撤 在 键盘 上 引 上 
但 毕竟 可 以 修复 ; 但 如 果 文 件 系统 被 破坏 了 ， 在 很 多 情况 下 是 无 法 恢复 


对 文件 属性 的 设置 来 控制 


F 只 读 文 件 ， 尽 管用 户 的 有 效 权限 是 读 / 写 ， 但 都 不 能 对 只 读 文件 进 
由 多 个 用 户 对 它们 进行 访问 。 


序 文件 、 客 户 档案 、 市 场 计 划 或 其 他 数据 文件 丢失 的 客户 来 说 ， 这 不 亚 于 一 场 大 的 灾难 。 
文件 系统 无 法 防止 设备 和 存储 介质 的 物理 损坏 ， 但 至 少 应 能 保护 信息 。 


户 对 


目 扩大 ， 在 所 有 稍 具 规模 的 系统 中 都 从 多 个 级 


目录 


防止 


的 用 
用 户 


用 户 权限 无 关 。 


对 文 


忆 的 故障 ， 尽 管 伤 脑筋 
的 。 特 别 是 对 于 那些 程 


尽管 
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(1) 转 储 和 恢复 。 在 文件 系统 中 无 论 是 硬件 或 软件 都 会 发 生 损坏 和 错误 ， 例 如 自然 界 的 闪 
电 、 电 压 的 突变 、 火 灾 和 水 灾 等 均 可 能 引起 软 /硬件 的 破坏 。 为 了 使 文件 系统 万 无 一 失 ， 应 当 采 
用 相应 的 措施 ， 最 简单 和 常用 的 措施 是 通过 转 储 操作 形成 文件 或 文件 系统 的 多 个 副本 。 这 样 ， 
一 旦 系统 出 现 故障 ， 利 用 转 储 的 数据 使 得 系统 恢复 成 为 可 能 。 常 用 的 转 储 方法 有 静态 转 储 和 动 
态 转 储 、 海 量 转 储 和 增 量 转 储 。 

(2) 日 志文 件 。 在 计算 机 系统 的 工作 过 程 中 ， 操 作 系统 把 用 户 对 文件 的 插入 、 删 除 和 修改 

操作 写 入 日 志文 件 。 一 旦 发 生 故 障 ， 操 作 系统 恢复 子 系统 利用 日 志文 件 来 进行 系统 故障 恢复 ， 
并 可 协助 后 备 副本 进行 介质 故障 恢复 。 
(3) 文件 系统 的 一 致 性 。 影 响 文 件 系统 可 靠 性 的 因素 之 一 是 文件 系统 的 一 致 性 问题 。 很 多 
文件 系统 是 先 读 取 磁 盘 块 到 主 存 ， 在 主 存 进行 修改 ， 修 改 完毕 再 写 回 磁盘 。 但 如 果 读 取 某 磁盘 
块 ， 修 改 后 再 将 信息 写 回 磁盘 前 系统 崩溃 ， 则 文件 系统 就 可 能 会 出 现 不 一 致 性 状态 。 如 果 这 些 
未 被 写 回 的 磁盘 块 是 索引 节点 块 、 目 录 块 或 空闲 块 ， 那 么 后 果 是 不 堪 设 想 的 。 通 常 ， 解 决 方案 
是 采用 文件 系统 的 一 致 性 检查 ， 一 致 性 检查 包括 块 的 一 致 性 检查 和 文件 的 一 致 性 检查 。 


4.6 ”作业 管理 


作业 是 系统 为 完成 一 个 用 户 的 计算 任务 〈 或 一 次 事务 处 理 ) 所 做 的 工作 总 和 。 例 如 ， 对 用 
户 编写 的 源 程序 ， 需 要 经 过 编译 、 链 接 、 装 入 以 及 执行 等 步骤 得 到 结果 ， 这 其 中 的 每 一 个 步骤 
称 为 作业 步 。 在 操作 系统 中 用 来 控制 作业 进入 、 执 行 和 撤销 的 一 组 程序 称 为 作业 管理 程序 。 操 
作 系 统 可 以 进一步 为 每 个 作业 创建 作业 步 进程 ， 完 成 用 户 的 工作 。 


4.6.1 基本 概念 


1. 作业 与 作业 控制 方式 


通常 ， 可 以 采用 脱 机 和 联机 两 种 控制 方式 控制 用 户 作业 的 运行 。 在 脱 机 控制 方式 中 ， 作 业 
运行 的 过 程 是 无 顷 人 工 干预 的 ， 因 此 ， 用 户 必须 将 自己 想 让 计算 机 干什么 的 意图 用 作业 控制 语 
言 (JCL) 编写 成 作业 说 明 书 ， 连 同 作 业 一 起 提交 给 计算 机 系统 。 在 联机 控制 方式 中 ， 操 作 系 
统 向 用 户 提供 了 一 组 联机 命令 ， 用 户 可 以 通过 终端 输入 命令 将 自己 想 让 计算 机 干什么 的 意图 告 
诉 计算 机 ， 以 控制 作业 的 运行 过 程 ， 因 此 整个 作业 的 运行 过 程 需要 人 工 干预 。 

作业 由 程序 、 数 据 和 作业 说 明 书 3 个 部 分 组 成 。 作 业 说 明 书 包括 作业 基本 情况 、 作 业 控 制 、 
作业 资源 要 求 的 描述 ， 它 体现 用 户 的 控制 意图 。 其 中 ， 作 业 基 本 情况 包括 用 户 名 、 作 业 名 、 编 
程 语言 和 最 大 处 理 时 间 等 ， 作 业 控 制 描述 包括 作业 控制 方式 、 作 业 步 的 操作 顺序 、 作 业 执行 出 
错 处 理 ， 作 业 资 源 要 求 描述 包括 处 理 时 间 、 优 先 级 、 主 存 空间 、 外 设 类 型 和 数量 等 。 
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2， 作 业 状 态 及 转换 
作业 状态 分 为 4 种 : 提交 、 后 备 、 执 行 和 完成 。 


(1) 提交 。 作 业 提 交 给 计算 机 中 心 ， 通 过 输入 设备 送 入 计算 机 系统 的 过 程 状态 称 为 提交 状态 。 


(2) 后 备 。 通 过 Spooling 系统 将 作业 输入 到 计算 机 系统 的 后 备 存储 器 〈 磁 盘 ) 上 


待 作业 调度 程序 调度 时 的 状态 。 


h， 随 时 等 


(3) 执行 。 一 旦 作业 被 作业 调度 程序 选中 ， 为 其 分 配 了 必要 的 资源 ， 并 为 其 建立 相应 的 进 


程 后 ， 该 作业 便 进 入 了 执行 状态 。 


(4) 完成 。 当 作业 正常 结束 或 异常 终止 时 ， 作 业 进入 完成 状态 。 此 时 ， 由 作业 调度 程序 对 
该 作业 进行 善后 处 理 。 如 撤销 作业 的 作业 控制 块 ， 收 回 作业 所 占 的 系统 资源 ， 将 作业 的 执行 结 


果 形 成 输出 文件 放 到 输出 井中 ， 由 Spooling 系统 控制 输出 。 
作业 的 状态 及 转换 如 图 4-31 所 示 。 


四 (ee) es (ee) 
| NAN 执行 
Ga 一 


图 4-31 作业 的 状态 及 其 转换 


3， 作业 控制 块 和 作业 后 备 队列 


所 谓 作业 控制 块 (JCB)， 是 记录 与 该 作业 有 关 的 各 种 信息 的 登记 表 。JCB 是 作业 存在 的 唯 


标志 ， 包 括 用 户 名 、 作 业 名 和 状态 标志 等 信息 。 


由 于 在 输入 井中 有 较 多 的 后 备 作 业 ， 为 了 便于 作业 调度 程序 调度 ， 通 常 将 作业 控制 块 排 成 
一 个 或 多 个 队列 ， 而 这 些 队列 称 为 作业 后 备 队列 。 也 就 是 说 ， 作 业 后 备 队 列 是 由 若干 个 JCB 组 


成 的 。 
4.6.2 ”作业 调度 


选择 调度 算法 需要 考虑 如 下 因素 : 与 系统 的 整个 设计 目标 一 致 ， 均 衡 地 使 用 系统 资源 ， 以 
及 平衡 系统 和 用 户 的 要 求 。 对 于 用 户 来 说 ， 作 业 能 “立即 执行 ”往往 难以 做 到 ， 但 是 应 保证 进 


入 系统 的 作业 在 规定 的 截止 时 间 内 完成 ， 而 且 系统 应 设法 缩短 作业 的 平均 周转 时 间 。 
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1. 作业 调度 算法 


常用 的 作业 调度 算法 如 下 。 

(1) 先 来 先 服务 。 按 作业 到 达 的 先后 进行 调度 ， 即 启动 等 待 时 间 最 长 的 作业 。 

(2) 短 作业 优先 。 以 要 求 运行 时 间 的 长 短 进行 调度 ， 即 启动 要 求 运行 时 间 最 短 的 作业 。 
(3) 响应 比 高 优先 。 响 应 比 高 的 作业 优先 启动 。 

定义 响应 比如 下 : 


二 作业 响应 时 间 
”作业 执行 时 间 
其 中 ， 作 业 响 应 时 间 为 作业 进入 系统 后 的 等 候 时 间 与 作业 的 执行 时 间 之 和 ， 即 
等 待 时 间 
E 业 执行 时 间 
对 于 响应 比 高 者 优先 算法 ， 在 每 次 调度 前 都 要 计算 所 有 被 选 作业 (在 作业 后 备 队列 中 ) 的 
响应 比 ， 然 后 选择 响应 比 最 高 的 作业 执行 。 该 算法 比较 复杂 ， 系 统 开销 大 。 
(4) 优先 级 调度 算法 。 可 由 用 户 指定 作业 优先 级 ， 优 先 级 高 的 作业 先 启动 。 也 可 由 系统 根 
据 作业 要 求 的 紧迫 程度 ， 或 者 照顾 “IO 繁忙 ”的 作业 ， 以 便 充 分 发 挥 外 设 的 效率 等 。 
(5) 均衡 调度 算法 。 这 种 算法 的 基本 思想 是 根据 系统 的 运行 情况 和 作业 本 身 的 特性 对 作业 
进行 分 类 。 作 业 调度 程序 轮流 地 从 这 些 不 同类 别 的 作业 中 挑选 作业 执行 。 这 种 算法 力求 均衡 地 
使 用 系统 的 各 种 资源 ， 既 注意 发 挥 系统 效率 ， 又 使 用 户 满意 。 
【 例 4.19】 作 业 也 、J2、J3 的 提交 时 间 和 所 需 运行 时 间 如 下 表 所 示 。 若 采用 响应 比 高 者 
优先 调度 算法 ， 则 作业 调度 次 序 为 1) 


提交 时 间 | 运行 时 间 (分 钟 ) 


R,=l+ 


(1) A.J1 一 一 了 3 B.JI 一 DB 一 了 2 C.JD 一 JI 一 了 3 D.JD 一 IJ 一 本 

分 析 : 空 (1) 的 正确 答案 是 B。 根 据 题 意 有 3 个 作业 卫 、 卫 、 了 3， 它们 到 达 输 入 井 的 时 
间 分 别 为 6:00、6:20、6:25， 它 们 需要 执行 的 时 间 分 别 为 30 分 钟 、20 分 钟 、6 分 钟 。 若 采用 响 
应 比 高 者 优先 算法 对 它们 进行 调度 ， 那 么 ， 系 统 在 6:00 时 ， 因 为 系统 输入 井中 只 有 作业 和 1， 因 
此 也 先 运行 。6:30 当 作业 J 运行 完毕 时 ， 先 计算 作业 J2 和 J3 的 响应 比 ， 然 后 令 响应 比 高 者 
运行 。 
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响应 比 三 作业 周转 时 间 / 作 业 运 行 时 间 
三 1 十 作业 等 待 时 间 / 作 业 运 行 时 间 
作业 了 的 响应 比 =1 十 10 /20=1.5 
作业 13 的 响应 比 =1 十 5/6=1.83 
按照 响应 比 高 者 优先 算法 ， 优 先 调度 J3。 
综 上 分 析 可 知 ， 作 业 被 选中 执行 的 次 序 应 是 卫 一 了 3 一 卫 。 


2. 作业 调度 算法 性 能 的 衡量 指标 


在 一 个 以 批量 处 理 为 主 的 系统 中 , 通常 用 平均 周转 时 间或 平均 带 权 周转 时 间 来 衡量 调度 性 
能 的 优 和 劣 。 假 设 作业 (i=1,2,…,n) 的 提交 时 间 为 如 ， 执 行 时 间 为 1;， 作 业 完成 时 间 为 ;， 则 
作业 二 的 周转 时 间 Z 和 带 权 周转 时 间 丙 分 别 定义 为 : 
T= ty C=,2,mD, W=T/t (i=1,2,,n) 


nn 个 作业 的 平均 周转 时 间 了 和 平均 带 权 周转 时 间 球 分 别 定义 为 : 
je Le 
?= et 


从 用 户 的 角度 来 说 ， 总 是 希望 自己 的 作业 在 提交 后 能 立即 执行 ， 这 意味 着 当 等 待 时 间 为 0 
时 作业 的 周转 时 间 最 短 , 即 = 。 但 是 , 作业 的 执行 时 间 #, 并 不 能 直观 地 衡量 出 系统 的 性 能 ， 
而 带 权 周 转 时 间 历 却 能 直观 地 反映 系统 的 调度 性 能 。 从 整个 系统 的 角度 来 说 , 不 可 能 满足 每 个 
用 户 的 这 种 要 求 ， 而 只 能 是 系统 的 平均 周转 时 间或 平均 带 权 周转 时 间 最 小 。 


4.6.3 ”用户 界面 


户 界 面 《User Interface) 是 计算 机 中 实现 用 户 与 计算 机 通信 的 软 /硬件 部 分 的 总 称 。 用 户 
界面 也 称 用 户 接口 ， 或 人 机 界面 。 
户 界面 的 硬件 部 分 包括 用 户 向 计算 机 输入 数据 或 命令 的 输入 装置 ， 以 及 由 计算 机 输出 供 
用 户 观察 或 处 理 的 输出 装置 。 用 户 界 面 的 软件 部 分 包括 用 户 与 计算 机 相互 通信 的 协议 、 约 定 、 
操纵 命令 及 其 处 理 软件 。 目 前 ， 常 用 的 输入 /输出 装置 有 键盘 、 鼠 标 、 显 示 器 和 打印 机 等 。 常 用 
的 人 机 通信 方法 有 命令 语言 、 选 项 、 表 格 填充 及 直接 操纵 等 。 从 计算 机 用 户 界 面 的 发 展 过 程 来 
看 ， 用 户 界面 可 分 为 如 下 阶段 。 

(1) 控制 面板 式 用 户 界面 。 这 是 计算 机 发 展 早期 ， 用 户 通过 控制 台 开 关 、 板 键 或 穿孔 纸 带 
向 计算 机 送 入 命令 或 数据 ， 而 计算 机 通过 指示 灯 及 打印 机 输出 运行 情况 或 结果 。 这 种 界面 的 特 
点 是 人 去 适应 现在 看 来 十 分 笨拙 的 计算 机 。 

(2) 字符 用 户 界面 。 字 符 用 户 界面 是 基于 字符 型 的 ， 用 户 通过 键盘 或 其 他 输入 设备 输入 字 
符 ， 由 显示 器 或 打印 机 输出 字符 。 字 符 用 户 界面 的 优点 是 功能 强 、 灵 活性 好 、 屏 幕 开 销 少 ; 缺 
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点 是 操作 步骤 烦琐 ， 学 会 操作 也 较 费 时 。 

(3) 图 形 用 户 界面 。 随 着 文字 、 图 形 、 声 音 和 图 像 等 多 媒体 技术 的 出 现 ， 各 种 图 形 用 户 界 
而 应 运 而 生 ， 用 户 既 可 使 用 传统 的 字符 ， 也 可 使 用 图 形 、 图 像 和 声音 同 计算 机 进行 交互 ， 操 作 
将 更 加 自然 、 更 加 方便 。 现 代 界 面 的 关键 技术 是 超 文本 。 超 文本 的 “ 超 ” 体 现在 它 不 仅 包括 文 
本 ， 还 包括 图 像 、 音 频 和 视频 等 多 媒体 信息 ， 即 将 文本 的 概念 扩充 到 超 文本 ， 超 文本 的 最 大 特 
点 是 具有 指向 性 。 

(4) 新 一 代用 户 界面 。 虚 拟 现实 技术 将 用 户 界 面 的 发 展 推 向 一 个 新 阶段 : 人 将 作为 参与 
者 ， 以 自然 的 方式 与 计算 机 生成 的 虚拟 环境 进行 通信 。 以 用 户 为 中 心 、 自 然 、 高 效 、 高 带 
宽 、 非 精确 、 无 地 点 限制 等 是 新 一 代用 户 界 面 的 特征 。 多 媒体 、 多 通道 及 智能 化 是 新 一 代 
用 户 界面 的 技术 支持 。 语 音 、 自 然 语言 、 手 势 、 头 部 跟踪 、 表 情 和 视线 跟踪 等 新 的 、 更 力 
自然 的 交互 技术 将 为 用 户 提供 更 方便 的 输入 技术 。 计 算 机 将 通过 多 种 感知 通道 来 理解 用 户 
的 意图 ， 实 现 用 户 的 要 求 。 计 算 机 不 仅 以 二 维 屏幕 向 用 户 输出 ， 而 且 以 真实 感 (立体 视觉 、 
听觉 、 噢 觉 和 触觉 等 ) 的 计算 机 仿真 环境 向 用 户 提供 真实 的 体验 。 
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计算 机 网 络 是 由 多 台 计 算 机 组 成 的 系统 , 与 传统 的 单机 系统 、 多 机 系统 相 比 有 很 大 的 区 别 。 
计算 机 网 络 的 结构 、 功 能 、 组 成 以 及 实现 技术 更 复杂 ， 维 护 起 来 难度 更 大 。 本 章 将 简要 介绍 计 
算 机 网 络 的 体系 结构 、 网 络 应 用 、 网 络 互 连 设备 、 网 络 构建 与 网 络 安全 方面 的 基本 内 容 ， 涉 及 
与 网 络 有 关 的 软 硬 件 和 应 用 知识 。 


5.1 计算 机 网 络 概述 


5.1.1 计算 机 网 络 的 概念 


1. 计算 机 网 络 的 发 展 


计算 机 网 络 是 计算 机 技术 与 通信 技术 日 益 发 展 和 密切 结合 的 产物 , 它 的 发 展 过 程 大 致 可 以 
划分 为 如 下 4 个 阶段 。 

1) 具有 通信 功能 的 单机 系统 

该 系统 又 称 终端 -计算 机 网 络 , 是 早期 计算 机 网 络 的 主要 形式 。 它 将 一 台 计算 机 经 通信 线路 
与 若干 终端 直接 相连 。 美 国 于 20 世纪 50 年 代 建 立 的 半自动 地 面 防空 系统 SAGE 就 属于 这 一 类 
网 络 。 它 把 远 距 离 的 雷达 和 其 他 测量 控制 设备 的 信息 通过 通信 线路 送 到 一 台 旋 风 型 计算 机 上 进 
行 处 理 和 控制 ， 首 次 实现 了 计算 机 技术 与 通信 技术 的 结合 。 

2) 具有 通信 功能 的 多 机 系统 

对 终端 -计算 机 网 进行 改进 : 在 主 计算 机 的 外 围 增 加 了 一 台 计 算 机 ， 专 门 用 于 处 理 终端 的 通 
信 信 息 及 控制 通信 线路 ， 并 能 对 用 户 的 作业 进行 某 些 预 处 理 操作 ， 这 人 台 计 算 机 称 为 “前 端 处 理 
机 ”或 “通信 控制 处 理 机 ”。 在 终端 设备 较 集中 的 地 方 设置 一 台 集 中 器 ， 终 端 通过 低速 线路 先 
汇集 到 集中 器 上 ， 然 后 再 用 高 速 线路 将 集中 器 连 到 主机 上 。 这 就 形成 了 多 机 系统 。 

3) 以 共享 资源 为 目的 的 计算 机 网 络 

具有 通信 功能 的 多 机 系统 是 计算 机 -计算 机 网 络 ， 它 是 由 若干 台 计 算 机 互联 的 系统 ， 即 利用 
通信 线路 将 多 台 计 算 机 连接 起 来 ， 在 计算 机 之 间 进 行 通信 。 该 网 络 有 两 种 结构 形式 ， 一 种 形式 
是 主 计算 机 通过 通信 线路 直接 互 连 的 结构 ， 其 中 主 计算 机 同时 承担 数据 处 理 和 通信 工作 ; 另 一 
种 形式 是 通过 通信 控制 处 理 机 间接 地 把 各 主 计算 机 连接 的 结构 ， 其 中 通信 处 理 机 和 主 计算 机 分 
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工 ， 前 者 负责 网 络 上 各 主 计算 机 间 的 通信 处 理 和 控制 ， 后 者 是 网 络 资源 的 拥有 者 ， 负 责 数 据 处 
理 ， 它 们 共同 组 成 资源 共享 的 计算 机 网 络 。20 世纪 70 年 代 ， 美 国 国防 部 高 级 研究 计划 局 所 研 
制 的 ARPANET 是 计算 机 -计算 机 网 络 的 典型 代表 。 最 初 该 网 络 仅 由 4 pai ala 到 
1975 年 ， 已 连接 100 多 台 不 同型 号 的 大 型 计算 机 。ARPANET 成 为 第 一 个 完善 地 实现 分 布 式 资 
源 共享 的 网 络 ， 为 计算 机 网 络 的 发 展 葛 定 了 基础 。 

在 这 期 间 ， 国 际 标 准 化 组 织 ISO〉 提 出 了 开放 系统 互 连 参 考 模型 OSURM (Open System 
Interconnection Reference Model)。 该 模型 定义 了 异种 机 联网 所 应 遵循 的 框架 结构 。OSI/RM 很 
快 得 到 了 国际 上 的 认可 ， 并 为 许多 厂商 所 接受 。 由 此 使 计算 机 网 络 的 发 展 进 入 了 新 的 阶段 。 

4) 以 局 域 网 及 因特网 为 支撑 环境 的 分 布 式 计算 机 系统 
局 域 网 是 继 远 程 网 之 后 发 展 起 来 的 ， 它 继承 了 远程 网 的 分 组 交换 技术 和 计算 机 的 IO 总 线 
结构 技术 。 局 域 网 的 发 展 也 促使 计算 机 网 络 的 模式 发 生 了 变革 ， 即 由 早期 的 以 大 型 机 为 中 心 的 
集中 式 模式 转变 为 由 微机 构成 的 分 布 式 计算 机 模式 。 

计算 机 网 络 的 定义 随 网 络 技术 的 更 新 可 从 不 同 的 角度 给 予 描述 。 目 前 人 们 已 公认 的 有 关 计 
算 机 网 络 的 定义 是 利用 通信 设备 和 线路 将 地 理 位 置 分 散 的 、 功 能 独立 的 自主 计算 机 系统 或 由 计 
算 机 控制 的 外 部 设备 连接 起 来 , 在 网 络 操作 系统 的 控制 下 , 按照 约定 的 通信 协议 进行 信息 交换 ， 
实现 资源 共享 的 系统 。 

定义 中 涉及 的 “资源 ”应 该 包括 硬件 资源 CPU、 大 容量 的 磁盘 、 光 盘 以 及 打印 机 等 ) 和 
软件 资源 〈 语 言 编译 器 、 文 本 编辑 器 、 各 种 软件 工具 和 应 用 程序 等 )。 


2. 计算 机 网 络 的 功能 


计算 机 网 络 提供 的 主要 功能 如 下 。 

(1) 数据 通信 。 通 信 或 数据 传输 是 计算 机 网 络 主要 功能 之 一 ， 用 以 在 计算 机 系统 之 间 传 送 
各 种 信息 。 利 用 该 功能 ， 地 理 位 置 分 散 的 生产 单位 和 业务 部 门 可 通过 计算 机 网 络 连接 在 一 起 进 
行 集中 控制 和 管理 。 也 可 以 通过 计算 机 网 络 传送 电子 邮件 , 发 布 新 闻 消息 及 进行 电子 数据 交换 ， 
极 大 地 方便 了 用 户 ， 提 高 了 工作 效率 。 

(2) 资源 共享 。 资 源 共享 是 计算 机 网 络 最 有 吸引 力 的 功能 。 通 过 资源 共享 ， 可 使 网 络 中 分 
散在 异地 的 各 种 资源 互通 有 无 ， 分 工 协作 ， 从 而 大 大 提高 系统 资源 的 利用 率 。 资 源 共享 包括 软 
件 资源 共享 和 硬件 资源 共享 。 

(3) 负载 均衡 。 在 计算 机 网 络 中 可 进行 数据 的 集中 处 理 或 分 布 式 处 理 ， 一 方面 可 以 通过 计 
算 机 网 络 将 不 同 地 点 的 主机 或 外 设 采集 到 的 数据 信息 送 往 一 台 指 定 的 计算 机 ， 在 此 计算 机 上 对 
数据 进行 集中 和 综合 处 理 ， 通 过 网 络 在 各 计算 机 之 间 传 送 原始 数据 和 计算 结果 ; 另 一 方面 ， 当 
网 络 中 某 台 计算 机 任务 过 重 时 ， 可 将 任务 分 派 给 其 他 空闲 的 多 台 计 算 机 ， 使 多 台 计算 机 相互 协 
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作 ， 均 衡 负 载 ， 共 同 完成 任务 。 

(4) 高 可 靠 性 。 指 在 计算 机 网 络 中 的 各 人 台 计 算 机 可 以 通过 网 络 彼此 互 为 后 备 机 ， 一 旦 某 台 
计算 机 出 现 故 障 ， 故 障 机 的 任务 就 可 由 其 他 计算 机 代为 处 理 ， 从 而 提高 系统 的 可 靠 性 。 避 免 了 
单机 无 后 备 使 用 的 情况 下 ， 计 算 机 出 现 故障 而 导致 系统 瘫痪 的 现象 ， 从 而 大 大 提高 了 系统 的 可 
靠 性 。 

借助 于 计算 机 网 络 ， 在 各 种 功能 软件 的 支持 下 ， 人 类 可 以 进行 高 速 的 异地 电子 信息 交换 ， 
并 获得 多 种 服务 ， 如 新 闻 浏 览 和 信息 检索 、 传 送 电子 邮件 、 多 媒体 电信 服务 、 远 程 教育 、 网 上 
营销 、 网 上 娱乐 和 远程 医疗 诊断 等 。 
计算 机 网 络 按照 数据 通信 和 数据 处 理 的 功能 , 可 分 为 两 层 : 内 层 通信 子 网 和 外 层 资源 子 网 ， 
如 图 5-1 所 示 。 通 信子 网 (图 5-1 中 虚线 内 ) 的 节点 计算 机 和 高 速 通信 线路 组 成 独立 的 数据 系 
统 ， 承 担 全 网 的 数据 传输 、 交 换 、 加 工 和 变换 等 通信 处 理工 作 ， 即 将 一 台 计 算 机 的 输出 信息 传 
送 给 另 一 台 计 算 机 。 资 源 子 网 (图 5-1 中 点 画 线 内 虚线 外 ) 包括 计算 机 、 终 端 、 通 信子 网 接口 
设备 、 外 部 设备 (如 打印 机 、 磁 带 机 和 绘图 机 等 ) 及 各 种 软件 资源 等 ， 它 负责 全 网 的 数据 处 理 
和 向 网 络 用 户 提供 网 络 资源 及 网 络 服务 。 


i 
2 、 


图 5-1 通信 子 网 和 资源 子 网 关系 图 
H 一 主 计算 机 ， T 一 终端 TIP 一 集线器 


通信 子 网 和 资源 子 网 的 划分 ， 完 全 符合 国际 标准 化 组 织 所 制定 的 开放 式 系统 互 连 参 考 模型 
(COSI) 的 思想 。 其 中 ， 通 信子 网 对 应 于 OSI 中 的 低 三 层 〈 物 理 层 、 数 据 链 路 层 、 网 络 层 )， 而 
资源 子 网 对 应 于 OSI 中 的 高 三 层 〈 会 话 层 、 表 示 层 、 应 用 层 )。 这 种 划分 将 通信 子 网 的 任务 从 
主机 中 抽取 出 来 ， 由 通信 子 网 中 的 设备 专门 解决 数据 传输 和 通信 控制 问题 。 而 资源 子 网 中 的 计 
算 机 可 集中 精力 处 理 数 据 ， 从 而 提高 主机 效率 和 网 络 的 整体 性 能 。 
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5.1.2 计算 机 网 络 的 分 类 


计算 机 网 络 的 分 类 方式 很 多 , 按照 不 同 的 分 类 原则 , 可 以 得 到 各 种 不 同类 型 的 计算 机 网 络 。 
如 ， 按 通信 距离 可 分 为 广域网 、 局 域 网 和 城 域 网 ， 按 信息 交换 方式 可 分 为 电路 交换 网 、 分 组 
交换 网 和 综合 交换 网 ; 按 网 络 拓扑 结构 可 分 为 星 型 网 、 树 型 网 、 环 型 网 和 总 线 网 ， 按 通信 介质 
可 分 为 双 绞 线 网 、 同 轴 电 缆 网 、 光 纤 网 和 卫星 网 等 ， 按 传输 带宽 可 分 为 基带 网 和 宽带 网 ， 按 使 
用 范围 可 分 为 公用 网 和 专用 网 ， 按 速率 可 分 为 高 速 网 、 中 速 网 和 低速 网 ， 按 通信 传播 方式 可 分 
为 广播 式 和 点 到 点 式 。 

这 里 主要 介绍 根据 计算 机 网 络 的 覆盖 范围 和 通信 终端 之 间 相 隔 的 距离 不 同 将 其 分 为 局 域 
网 、 城 域 网 和 广域网 三 类 的 情况 ， 各 类 网 络 的 特征 参数 如 表 5-1 所 示 。 


表 5-1 各 类 网 络 的 特征 参数 


网 络 分 类 计算 机 分 布 范围 传输 速率 范围 


| lomz 右 | 房间 | 
局 域 网 | 4Mb/s~1Gb/s 
城 域 网 50Kb/s~100Mb/s 
广域网 国家 或 全 球 9.6Kb/s~45Mb/s 


1. 局 域 网 


局 域 网 (Local Area Network，LAN) 是 指 传输 距离 有 限 ， 传 输 速度 较 高 ， 以 共享 网 络 资源 
为 目的 的 网 络 系统 。 由 于 局 域 网 投资 规模 较 小 ， 网 络 实现 简单 ， 故 新 技术 易于 推广 。 局 域 网 技 
术 与 广域网 相 比 发 展 迅速 。 局 域 网 的 特点 如 下 

(1) 分 布 范围 有 限 。 加 入 局 域 网 中 的 计算 机 通常 处 在 几 千 米 的 距离 之 内 。 通 常 它 分 布 在 一 
个 学 校 、 一 个 企业 单位 ， 为 本 单位 使 用 。 一 般 称 为 “园区 网 ”或 “校园 网 ”。 

(2) 有 较 高 的 通信 带宽 ， 数 据 传 输 率 高 。 一 般 为 1Mb/s 以 上 ， 最 高 已 达 1000Mb/s。 

(3) 数据 传输 可 靠 ， 误 码 率 低 。 误 码 率 一 般 为 10 “一 10“。 

(4) 通常 采用 同 轴 电 线 或 双 绞 线 作 为 传输 介质 。 跨 楼 寅 时 使 用 光纤 。 

(5) 拓扑 结构 简单 简洁 ， 大 多 采用 总 线 、 星 型 和 环 型 等 ， 系 统 容易 配置 和 管理 。 网 上 的 计 
算 机 一 般 采 用 多 路 控制 访问 技术 或 令 牌 技术 访问 信道 。 

(6) 网 络 的 控制 一 般 趋向 于 分 布 式 ， 从 而 减少 了 对 某 个 节点 的 依赖 性 ， 避 免 并 减 小 了 一 
节点 故障 对 整个 网 络 的 影响 。 

(7) 通常 网 络 归 单一 组 织 所 拥有 和 使 用 。 不 受 任何 公共 网 络 管理 机 构 的 规定 约束 ， 容 易 进 
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行 设备 的 更 新 和 新 技术 的 引用 ， 以 不 断 增强 网 络 功能 。 
2. 城 域 网 


城 域 网 (Metropolitan Area Network，MAN) 是 规模 介 于 局 域 网 和 广域网 之 间 的 一 种 较 大 范 
围 的 高 速 网 络 ， 一 般 履 盖 临 近 的 多 个 单位 和 城市 ， 从 而 为 接 入 网 络 的 企业 、 机 关 、 公 司 及 社会 
单位 提供 文字 、 声 音 和 图 像 的 集成 服务 。 城 域 网 规范 由 IEEE 802.6 协议 定义 。 


3， 广域网 


广域网 (Wide Area Network，WAN) 又 称 远程 网 ， 它 是 指 履 盖 范 围 广 、 传 输 速率 相对 较 低 、 
以 数据 通信 为 主要 目的 的 数据 通信 网 。 广 域 网 最 根本 的 特点 如 下 。 

(1) 分 布 范围 广 。 加 入 广域网 中 的 计算 机 通常 处 在 从 数 公里 到 数 千 公 里 的 地 方 。 因 此 ， 网 
络 所 涉及 的 范围 可 为 市 、 地 区 、 省 、 国 家 乃至 世界 。 

(2) 数据 传输 率 低 。 一 般 为 几 十 兆 位 每 秒 以 下 。 

(3) 数据 传输 可 靠 性 随 着 传输 介质 的 不 同 而 不 同 ， 若 用 光纤 ， 误 码 率 一 般 在 105~~101 
之 间 。 

(4) 广域网 常常 借用 传统 的 公共 传输 网 来 实现 ， 因 为 单独 建造 一 个 广域网 极其 昂贵 。 

(5) 拓扑 结构 较为 复杂 ， 大 多 采用 “分 布 式 网 络 ” 即 所 有 计算 机 都 与 交换 节点 相连 ， 从 
而 实现 网 络 中 任何 两 台 计 算 机 都 可 以 进行 通信 。 
广域网 的 布局 不 规则 ， 使 得 网 络 的 通信 控制 比较 复杂 。 尤其 是 使 用 公共 传输 网 ， 要 求 连接 
到 网 上 的 任何 用 户 都 必须 严格 遵守 各 种 标准 和 规程 。 设 备 的 更 新 和 新 技术 的 引用 难度 较 大 。 广 
域 网 可 将 一 个 集团 公司 、 团 体 或 一 个 行业 的 各 处 部 门 和 子 公 司 连 接 起 来 。 这 种 网 络 一 般 要 求 兼 
容 多 种 网 络 系统 ( 异 构 网 络 )。 


5.1.3 网络 的 拓扑 结构 


网 络 拓扑 结构 是 指 网 络 中 通信 线路 和 节点 的 几何 排序 ， 用 以 表示 整个 网 络 的 结构 外 貌 ， 反 
映 各 节点 之 间 的 结构 关系 。 它 影响 着 整个 网 络 的 设计 、 功 能 、 可 靠 性 和 通信 费用 等 重要 方面 ， 
是 计算 机 网 络 十 分 重要 的 要 素 。 常 用 的 网 络 拓扑 结构 有 总 线 型 、 星 型 、 环 型 、 树 型 和 分 布 式 结 
构 等 。 


1， 总 线 型 结构 
总 线 型 拓扑 结构 如 图 5-2 a》 所 示 ， 其 特点 为 总 线 型 拓扑 结构 中 只 有 一 条 双向 通路 ， 便 于 


进行 广播 式 传送 信息 ; 总 线 型 拓扑 结构 属于 分 布 式 控制 ， 无 须 中 央 处 理 器 ， 故 结构 比较 简单 ; 
节点 的 增 、 删 和 位 置 的 变动 较 容易 ， 变 动 中 不 影响 网 络 的 正常 运行 ， 系 统 扩充 性 能 好 ;节点 的 


n 


接口 通常 采用 无 源 线路 ， 系 统 可 靠 性 高 ;设备 少 ， 价 格 低 ， 安 装 使 
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方便， 由 于 电气 信号 通路 


多 ， 干 扰 较 大 ， 因 此 对 信号 的 质量 要 求 高 。 负 载重 时 ， 线 路 的 利用 率 较 低 。 网 上 的 信息 延迟 时 


间 不 确定 ， 故 障 隔离 和 检测 困难 。 


央 单元 采用 


(a) 总 线 型 (b) 星 型 


一 


Ee 


口 | | 


~ 1 


(c) 环 型 


(d) 树 型 Ce) 分 布 式 


图 5-2 常用 的 网 络 拓扑 结构 


星 型 结构 中 ， 使 用 中 央 交 换 单元 以 放射 状 连接 到 网 中 的 各 个 节点 ， 如 图 5-2 (b) 所 示 。 中 


电路 交换 方式 以 建立 所 希望 通信 的 两 节点 间 专 用 的 路 径 。 通 常用 双 绞 线 将 节点 与 中 


央 单 元 进行 连接 。 其 特点 为 维护 管理 容易 ， 重 新 配置 灵活 ;故障 隔离 和 检测 容易 ， 网 络 延 迟 时 
间 短 ; 各 节点 与 中 央 交 换 单元 直接 连通 ， 各 节点 之 间 通 信 必 须 经 过 中 央 单 元 转换 ， 网 络 共享 能 
力 差 ; 线路 利用 率 低 ， 中 央 单 元 负荷 重 。 


首尾 相 


是 


3， 环 型 结构 


环 型 结构 的 信息 传输 线路 构成 一 个 封闭 的 环 型 ， 各 节点 通过 中 继 器 连 入 网 内 ， 各 中 继 器 间 


接 ， 如 图 5-2(c) 所 示 。 信 息 单 向 沿 环 路 逐 点 传送 。 其 特点 为 环 型 网 中 信息 的 流动 方向 
司 定 的 ， 两 个 节点 仅 有 一 条 通路 ， 路 径 控 制 简单 ， 有 旁 路 设备 ， 节 点 一 旦 发 生 故 障 ， 系 统 自 


动 旁 路 ， 可 靠 性 高 ;信息 要 串 行 穿 过 多 个 节点 ， 在 网 中 节点 过 多 时 传输 效率 低 ， 系 统 响 应 速度 


慢 ; 


于 环 路 封闭 ， 扩 充 较 难 。 
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树 型 结构 是 总 线 型 结构 的 扩充 形式 ， 传 输 介质 是 不 封闭 的 分 支 电 缆 ， 如 图 5-2 〈d) 所 示 。 
它 主要 用 于 多 个 网 络 组 成 的 分 级 结构 中 。 其 特点 同 总 线 型 网 。 


S， 分布 式 结构 


分 布 式 结构 无 严格 的 布点 规定 和 形状 ， 各 节点 之 间 有 多 条 线路 相连 ， 如 图 5-2 〈e) 所 示 。 
其 特点 为 分 布 式 网 有 较 高 的 可 靠 性 ， 当 一 条 线路 有 故障 时 ， 不 会 影响 整个 系统 工作 ; 资源 共享 
方便 ， 网 络 响应 时 间 短 ;由 于 节点 与 多 个 节点 连接 ， 故 节点 的 路 由 选择 和 流量 控制 难度 大 ， 管 
理 软件 复杂 ; 硬件 成 本 高 。 

广域网 与 局 域 网 所 使 用 的 网 络 拓扑 结构 有 所 不 同 ， 广 域 网 多 用 分 布 式 或 树 型 结构 ， 而 局 域 
网 常 使 用 总 线 型 、 环 型 、 星 型 或 树 型 结构 。 


5.2 网络 硬件 基础 


构建 一 个 实际 的 网 络 ， 需 要 网 络 的 传输 介质 、 网 络 互 连 设备 作为 支持 。 本 节 主要 介绍 构建 
网 络 的 传输 介质 和 互 连 设备 。 


5.2.1 网 络 设备 


网 络 互 连 的 目的 是 使 一 个 网 络 的 用 户 能 访问 其 他 网 络 的 资源 ， 使 不 同 网 络 上 的 用 户 能 够 互 
相通 信和 交换 信息 ， 实 现 更 大 范围 的 资源 共享 。 在 网 络 互 连 时 ， 一 般 不 能 简单 地 直接 相连 ， 而 
是 通过 一 个 中 间 设 备 来 实现 。 按 照 ISO/OSI 的 分 层 原则 ， 这 个 中 间 设 备 要 实现 不 同 网 络 之 间 的 
协议 转换 功能 ， 根 据 它们 工作 的 协议 层 不 同 进行 分 类 。 网 络 互 连 设备 可 以 有 中 继 器 〈 实 现 物理 
层 协 议 转换 ， 在 电缆 间 转 发 二 进 制 信 号 )、 网 桥 〈 实 现 物 理 层 和 数据 链 路 层 协议 转换 )、 路 由 器 
(实现 网 络 层 和 以 下 各 层 协 议 转换 )、 网 关 〈 提 供 从 最 低层 到 传输 层 或 以 上 各 层 的 协议 转换 ) 和 
交换 机 等 。 


1， 网 络 传输 介质 互 连 设备 


网 络 线路 与 用 户 节点 具体 衔接 时 ， 需 要 网 络 传输 介质 的 互 连 设备 。 如 T 型 头 〈 细 同 轴 电 缆 
连接 器 )、 收 发 器 、RJ-45〈 屏 蔽 或 非 屏蔽 双 绞 线 连 接 器 )、RS232 接口 (目前 计算 机 与 线路 接口 
的 常用 方式 )、DB-15 接口 (连接 网 络 接 口 卡 的 AUI 接口 )、VB35 同步 接口 (连接 远程 的 高 速 
同步 接口 )、 网 络 接口 单元 和 调制 解 调 器 〈 数 字 信号 与 模拟 信号 转换 器 ) 等 。 
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2. 物理 层 的 互 连 设备 


物理 层 的 互 连 设备 有 中 继 器 (Repeater) 和 集线器 (Hub)。 
1) 中 继 器 
它 是 在 物理 层 上 实现 局 域 网 网 段 互 连 的 ， 用 于 扩展 局 域 网 网 段 的 长 度 。 由 于 中 继 器 只 在 两 
局 域 网 网 段 间 实 现 电 气 信号 的 恢复 与 整形 ， 因 此 它 仅 用 于 连接 相同 的 局 域 段 。 
理论 上 说 ， 可 以 用 中 继 器 把 网 络 延长 到 任意 长 的 传输 距离 ， 但 是 ， 局 域 网 中 接 入 的 中 继 器 
的 数量 将 受 时 延 和 衰 耗 的 影响 ， 因 而 必须 加 以 限制 。 例 如 ， 在 以 太 网 中 最 多 使 用 4 个 中 继 器 。 
以 太 网 设计 连 线 时 指定 两 个 最 远 用 户 之 间 的 距离 ,包括 用 于 局 域 网 的 连接 电缆 , 不 得 超过 500m。 
即便 使 用 了 中 继 器 ， 典 型 的 Ethernet 局 域 网 应 用 要 求 从 头 到 尾 整个 路 径 不 超过 1500m。 中 继 器 
的 主要 优点 是 安装 简便 、 使 用 方便 、 价 格 便宜 。 
2) 集线器 
可 以 看 成 是 一 种 特殊 的 多 路 中 继 器 ， 也 具有 信号 放大 功能 。 使 用 双 绞 线 的 以 太 网 多 用 Hub 
扩大 网 络 ， 同 时 也 便于 网 络 的 维护 。 以 集线器 为 中 心 的 网 络 优点 是 当 网 络 系统 中 某 条 线路 或 某 
节点 出 现 故 障 时 ， 不 会 影响 网 上 其 他 节点 的 正常 工作 。 集 线 器 可 分 为 无 源 〈Passive) 集线器 、 
有 源 (Active) 集线器 和 智能 (Intelligent) 集线器 。 
无 源 集线器 只 负责 把 多 段 介质 连接 在 一 起 ， 不 对 信号 作 任 何 处理 ， 每 一 种 介质 段 只 允许 扩 
展 到 最 大 有 效 距离 的 一 半 ; 有 源 集线器 类 似 于 无 源 集线器 ， 但 它 具 有 对 传输 信号 进行 再 生 和 放 
大 从 而 扩展 介质 长 度 的 功能 ， 智 能 集线器 除 具有 有 源 集线器 的 功能 外 ， 还 可 将 网 络 的 部 分 功能 
集成 到 集线器 中 ， 如 网 络 管理 、 选 择 网 络 传输 线路 等 。 


3 数据 链 路 层 的 互 连 设备 


数据 链 路 层 的 互 连 设 备 有 网 桥 〈Bridge) 和 交换 机 (Switch ) 。 

1) 网 桥 

于 连接 两 个 局 域 网 网 段 ， 工 作 于 数据 链 路 层 。 网 桥 要 分 析 帧 地 址 字段 ， 以 决定 是 否 把 收 
到 的 帧 转发 到 另 一 个 网 络 段 上 。 确 切 地 说 ， 网 桥 工 作 于 MAC 子 层 ， 只 要 两 个 网 络 MAC 子 层 
以 上 的 协议 相同 ， 都 可 以 用 网 桥 互 连 。 
网 桥 检 查 帧 的 源 地 址 和 目的 地 址 ， 如 果 目 的 地 址 和 源 地 址 不 在 同一 个 网 络 段 上 ， 就 把 帧 转 
发 到 另 一 个 网 络 段 上 ;车 两 个 地 址 在 同一 个 网 络 段 上 ， 则 不 转发 ， 所 以 网 桥 能 起 到 过 滤 帧 的 作 
用 。 网 桥 的 帧 过 滤 特 性 很 有 用 ， 当 一 个 网 络 由 于 负载 很 重 而 性 能 下 降 时 ， 可 以 用 网 桥 把 它 分 成 
两 个 网 络 段 并 使 得 段 间 的 通信 量 保持 最 小 。 例 如 ， 把 分 布 在 两 层 楼 上 的 网 络 分 成 每 层 一 个 网 络 
段 ， 段 中 间 用 网 桥 相 连 ， 这 样 的 配置 可 以 最 大 限度 地 缓解 网 络 通信 繁忙 的 程度 ， 提 高 通信 效率 。 
同时 ， 由 于 网 桥 的 隔离 作用 ， 一 个 网 络 段 上 的 故障 不 会 影响 到 另 一 个 网 络 段 ， 从 而 提高 了 网 络 


> 
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的 可 靠 性 。 

2) 交换 机 

交换 机 是 一 个 具有 简化 、 低 价 、 高 性 能 和 高 端口 密集 特点 的 交换 产品 ， 它 是 按 每 一 个 包 中 
的 MAC 地 址 相对 简单 地 决策 信息 转发 ， 而 这 种 转发 决策 一 般 不 考虑 包 中 隐藏 的 更 深 的 其 他 信 
息 。 交 换 机 转发 数据 的 延迟 很 小 ,操作 接近 单个 局 域 网 性 能 ， 远 远 超 过 了 普通 桥接 的 转发 性 能 。 
交换 技术 允许 共享 型 和 专用 型 的 局 域 网 段 进行 带宽 调整 ， 以 减轻 局 域 网 之 间 信息 流通 出 现 的 瓶 
颈 问题 。 

交换 机 的 工作 过 程 为 : 当 交 换 机 从 某 一 节点 收 到 一 个 以 太 网 帧 后 ， 将 立即 在 其 内 存 中 的 地 
址 表 〈 端 口号 一 MAC 地 址 ) 进行 查找 ， 以 确认 该 目的 MAC 的 网 卡 连接 在 哪 一 个 节点 上 ， 然 后 
将 该 帧 转发 至 该 节点 。 如 果 在 地 址 表 中 没有 找到 该 MAC 地 址 ， 也 就 是 说 ， 该 目的 MAC 地 址 
是 首次 出 现 ， 交 换 机 就 将 数据 包 广 播 到 所 有 节点 。 拥 有 该 MAC 地 址 的 网 卡 在 接收 到 该 广播 帧 
后 ， 将 立即 做 出 应 答 ， 从 而 使 交换 机 将 其 节点 的 “MAC 地 址 ”添加 到 MAC 地 址 表 中 。 

交换 机 的 三 种 交换 技术 : 端口 交换 、 帧 交换 和 信 元 交换 。 

(1) 端口 交换 技术 用 于 将 以 太 模块 的 端口 在 背 板 的 多 个 网 段 之 间 进 行 分 配 、 平 衡 。 

(2) 帧 交换 技术 对 网 络 帧 的 处 理 方式 分 为 直通 交换 和 存储 转发 。 其 中 ,直通 交换 方式 可 提 
线 速 处 理 能 力 ， 交 换 机 只 读 出 网 络 帧 的 前 14 个 字 节 ， 便 将 网 络 帧 传送 到 相应 的 端口 上 ; 
存储 转发 方式 通过 对 网 络 帧 的 读 取 进行 验 错 和 控制 。 

(3) 信 元 交换 技术 采用 长 度 (53 个 字 节 ) 固定 的 信 元 交换 ， 由 于 长 度 固 
件 实现 。 


4. 网络 层 互联 设备 


而 便于 用 硬 


路 由 器 (Router) 是 网 络 层 互联 设备 ， 用 于 连接 多 个 逻辑 上 分 开 的 网 络 。 风 辑 网 络 是 指 一 
个 单独 的 网 络 或 一 个 子 网 ， 当 数据 从 一 个 子 网 传输 到 另 一 个 子 网 时 ， 可 通过 路 由 器 来 完成 。 

路 由 器 具有 很 强 的 异种 网 互 连 能 力 ， 互 连 的 网 络 最 低 两 层 协议 可 以 互 不 相同 ， 通 过 驱动 软 
件 接口 到 第 三 层 上 而 得 到 统一 。 对 于 互连网 络 的 第 三 层 协 议 ， 如 果 相 同 ， 可 使 用 单 协议 路 由 器 
进行 互 连 ; 如 果 不 同 ,， 则 应 使 用 多 协议 路 由 器 。 多 协议 路 由 器 同时 支持 多 种 不 同 的 网 络 层 协议 ， 
并 可 以 设置 为 允许 或 禁止 某 些 特定 的 协议 。 所 谓 支持 多 种 协议 ， 是 指 支持 多 种 协议 的 路 由 ， 而 
不 是 指 不 同类 协议 的 相互 转换 。 

通常 把 网 络 层 地 址 信息 叫 作 网 络 逻辑 地 址 ， 把 数据 链 路 层 地 址 信息 叫 作物 理 地 址 。 路 由 器 
最 主要 的 功能 是 选择 路 径 。 在 路 由 器 的 存储 器 中 维护 着 一 个 路 径 表 , 记录 各 个 网 络 的 逻辑 地 址 ， 
用 于 识别 其 他 网 络 。 在 互连网 络 中 ， 当 路 由 器 收 到 从 一 个 网 络 向 另 一 个 网 络 发 送 的 信息 包 时 ， 
将 丢弃 信息 包 的 外 层 ， 解 读 信息 包 中 的 数据 ， 获 得 目的 网 络 的 逻辑 地 址 ， 使 用 复杂 的 程序 来 决 
定 信息 经 由 哪 条 路 径 发 送 最 合适 ， 然 后 重新 打包 并 转发 出 去 。 路 由 器 的 功能 还 包括 过 滤 、 存 储 
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转发 、 流 量 管理 和 介质 转换 等 。 一 些 增强 功能 的 路 由 器 还 可 有 加 密 、 数 据 压缩 、 优 先 和 容错 管 
理 等 功能 。 由 于 路 由 器 工作 于 网 络 层 ， 它 处 理 的 信息 量 比 网 桥 要 多 ， 因 而 处 理 速度 比 网 桥 慢 。 


S， 应 用 层 互联 设备 


网 关 〈Gateway) 是 应 用 层 的 互 连 设 备 。 在 一 个 计算 机 网 络 中 ， 当 连接 不 同类 型 而 协议 差 
别 又 较 大 的 网 络 时 ， 则 要 选用 网 关 设 备 。 网 关 的 功能 体现 在 OSI 模型 的 最 高 层 ， 它 将 协议 进行 
转换 ， 将 数据 重新 分 组 ， 以 便 在 两 个 不 同类 型 的 网 络 系统 之 间 进 行 通信 。 由 于 协议 转换 是 一 件 
复杂 的 事 ， 一 般 来 说 ， 网 关 只 进行 一 对 一 转换 ， 或 是 少数 几 种 特定 应 用 协议 的 转换 ， 网 关 很 难 
实现 通用 的 协议 转换 。 
5.2.2 ”网 络 传输 介质 


传输 介质 是 信号 传输 的 媒体 ， 常 用 的 介质 分 为 有 线 介质 和 无 线 介质 。 有 线 介质 有 双 绞 线 、 
同 轴 电 缆 和 光纤 等 ;无 线 介质 有 微波 、 红 外 线 和 激光 等 。 


1， 双 绞 线 (Twisted-Pair) 


双 绞 线 是 现在 最 普通 的 传输 介质 ， 它 分 为 屏蔽 双 绞 线 (STP) 和 非 屏蔽 双 绞 线 (UTP)。 非 
屏蔽 双 绞 线 有 线 缆 外 皮 作 为 屏蔽 层 ， 适 用 于 网 络 流量 不 大 的 场合 中 。 屏 蔽 式 双 绞 线 具 有 一 个 金 
属 甲 套 ， 对 电磁 干扰 具有 较 强 的 抵抗 能 力 ， 适 用 于 网 络 流量 较 大 的 高 速 网 络 协议 应 用 。 双 绞 线 
又 可 分 为 3 类 、4 类 、5 类 、6 类 和 7 类 双 绞 线 , 现在 常用 的 是 5 类 UTP, 其 频率 带宽 为 100MHz。 
6 类 、7 类 双 绞 线 分 别 可 工作 于 200MHz 和 600MHz 的 频率 带宽 之 上 ， 且 采用 特殊 设计 的 RJ45 
插头 


双 绞 线 最 多 应 用 于 10Base-T 和 100Base-T 的 以 太 网 中 ,具体 规定 有 : 一 段 双 绞 线 的 最 大 长 
度 为 100m， 只 能 连接 一 台 计 算 机 ; 双 绞 线 的 每 端 需要 一 个 RJ45 插件 ， 各 段 双 绞 线 通过 集线器 
互联 ， 利 用 双 绞 线 最 多 可 连接 64 个 站 点 到 中 继 器 。 


2. 同 轴 电 绕 (Coaxial) 


同 轴 电 费 也 像 双 绞 线 那样 由 一 对 导体 组 成 。 同 轴 电 缆 又 分 为 基带 同 轴 电 缆 《〈 阻 抗 为 50Q) 
和 宽带 同 轴 电 缆 〈 阻 抗 为 739)。 基 带 同 轴 电 费用 来 直接 传输 数字 信号 ， 它 又 分 为 粗 同 轴 电 缆 和 组 
同 轴 电 缆 ， 其 中 粗 同 轴 电 缆 适 用 于 较 大 局 域 网 的 网 络 干线 ， 布 线 距离 较 长 ， 可 靠 性 较 好 ， 但 是 
网 络 安装 、 维 护 等 方面 比较 困难 ， 造 价 较 高 ， 而 细 同 轴 电 缆 安装 较 容 易 ， 而 且 造 价 较 低 ， 但 
受 网 络 布线 结构 的 限制 ， 其 日 常 维护 不 太 方 便 。 宽 带 同 轴 电 费用 于 频 分 多 路 复 用 (FDM) 的 模 
拟 信号 发 送 ， 还 用 于 不 使 用 频 分 多 路 复 用 的 高 速 数字 信号 发 送 和 模拟 信号 发 送 。 闭 路 电视 所 使 
用 的 CATV 电缆 就 是 宽带 同 轴 电 缆 。 
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3. 光纤 (Fiber Optic) 


光 导 纤维 简称 光纤 ， 它 重量 轻 ， 体 积 小 。 用 光纤 传输 电信 号 时 ， 在 发 送 端 先 要 将 其 转换 成 
光 信 号 ， 而 在 接收 端 又 要 由 光 检 波 器 还 原 成 电信 号 。 光 纤 是 软 而 细 的 、 利 用 内 部 全 反射 原理 来 
传导 光束 的 传输 介质 。 按 光源 采用 不 同 的 发 光 管 分 为 发 光 二 极 管 和 注入 型 激光 二 极 管 。 多 模 光 
纤 (Multimode Fiber) 使 用 的 材料 是 发 光 二 极 管 , 价格 较 便宜 , 但 定向 性 较 差 ; 单 模 光纤 (Single 
Mode Fiber) 使 用 的 材料 是 注入 型 二 极 管 ， 定 向 性 好 ， 损 耗 少 ， 效 率 高 ， 传 播 距 离 长 ， 但 价格 
昂贵 。 


4. 微波 


出 


微波 通信 是 在 对 流 层 视线 距离 范围 内 利用 无 线 电波 进行 传输 的 一 种 通信 方式 , 频率 范围 为 
2 一 40GHz。 微 波 通信 是 沿 直线 传播 的 ， 由 于 地 球 表面 是 曲面 ， 微 波 在 地 面 的 传播 距离 有 限 ， 直 
接 传播 的 距离 与 天 线 的 高 度 有 关 ， 天 线 越 高 传播 距离 越 远 ， 但 超过 一 定 距离 后 就 要 用 中 继 站 来 
接力 ， 两 微波 站 的 通信 距离 一 般 为 30 一 50km， 长 途 通 信 时 必须 建立 多 个 中 继 站 。 中 继 站 的 功 
能 是 变频 和 放大 ， 进 行 功率 补偿 。 微 波 通 信 分 为 模拟 微波 通信 和 数字 微波 通信 两 种 。 模 拟 微波 
通信 主要 采用 调频 制 , 数字 微波 通信 大 都 采用 相 移 键 控 (PSK)。 微波 通信 的 传输 质量 比较 稳定 ， 
影响 质量 的 主要 因素 是 雨 雪 天 气 对 微波 产生 的 吸收 损耗 ， 不 利 地形 或 环境 对 微波 所 造成 的 衰减 
现象 。 


5. 红外 线 和 激光 


红外 通信 和 激光 通信 也 像 微 波 通信 一 样 ， 有 很 强 的 方向 性 ， 都 是 沿 直线 传播 的 。 这 三 种 技 
术 都 需要 在 发 送 方 和 接收 方 之 间 有 一 条 视线 (Line-of-sight) 通路 , 有 时 统称 这 三 者 为 视线 媒体 。 
所 不 同 的 是 ， 红 外 通信 和 激光 通信 把 要 传输 的 信号 分 别 转换 为 红外 光 信 号 和 激光 信号 ， 直 接 在 
空间 传播 。 由 于 这 三 种 视线 媒体 都 不 需要 铺设 电缆 ， 对 于 不 论 是 在 地 下 或 用 电线 杆 很 难 在 建筑 
物 之 间架 设 电 缆 ， 特 别 是 要 穿越 的 空间 属于 公共 场所 的 局 域 网 特别 有 用 。 但 这 三 种 技术 对 环境 
气候 较为 敏感 ， 例 如 雨 、 雾 和 雷电 。 相 对 来 说 ， 微 波 一 般 对 雨 和 和 雾 的 敏感 度 较 低 。 


6. 卫星 通信 
卫星 通信 和 是 以 人 造 卫星 为 微波 中 继 站 ， 它 是 微波 通信 的 特殊 形式 。 卫星 接收 来 自 地 面 发 送 
站 发 出 的 电磁 波 信号 后 ， 再 以 广播 方式 用 不 同 的 频率 发 回 地 面 ， 被 地 面 工作 站 接收 。 卫 星 通信 


可 以 克服 地 面 微 波 通信 距离 的 限制 。 一 个 同步 卫星 可 以 覆盖 地 球 的 1/3 以 上 表面 ， 三 个 这 样 的 
卫星 就 可 以 覆盖 地 球 上 全 部 通信 区 域 ， 这 样 地 球 上 的 各 个 地 面 站 之 间 都 可 互相 通信 了 。 由 于 卫 
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星 信道 频带 宽 ， 也 可 采用 频 分 多 路 复 用 技术 分 为 若干 个 子 信道 ， 有 些 用 于 由 地 面 站 向 卫星 发 送 
〈 称 为 上 行 信道 )， 有 些 用 于 由 卫星 向 地 面 转发 〈 称 为 下 行 信道 )。 卫 星 通信 的 优点 是 容量 大 、 
距离 远 ， 缺 点 是 传播 延迟 时 间 长 。 


5.3 1ISO/OSI 网 络 体系 结构 


计算 机 网 络 是 相当 复杂 的 系统 ， 相 互通 信 的 两 个 计算 机 系统 必须 高 度 协调 才能 正常 工作 。 
为 了 设计 这 样 复杂 的 计算 机 网 络 ， 人 们 提出 了 将 网 络 分 层 的 方法 。 分 层 可 将 庞大 而 复杂 的 问题 
转化 为 若干 较 小 的 局 部 问题 进行 处 理 ， 从 而 使 问题 简单 化 。 
国际 标准 化 组 织 在 1977 年 成 立 了 一 个 分 委员 会 专门 研究 网 络 通信 的 体系 结构 问题 ， 并 提 
出 了 开放 系统 互 连 参考 模型 ， 它 是 一 个 定义 异种 计算 机 连接 标准 的 框架 结构 。OSI 为 连接 分 布 
式 应 用 处 理 的 “开放 ”系统 提供 了 基础 。 所 谓 “ 开 放 ”， 是 指 任何 两 个 系统 只 要 遵守 参考 模型 
和 有 关 标 准 ， 都 能 够 进行 互 连 。OSI 采用 了 层次 化 结构 的 构造 技术 。 

ISO 分 委员 会 的 任务 是 定义 一 组 层次 和 每 一 层 所 完成 的 功能 和 服务 。 层 次 的 划分 应 当 从 由 
辑 上 将 功能 分 组 ， 层 次 应 该 足够 多 ， 应 使 每 一 层 小 到 易于 管理 的 程度 ， 但 也 不 能 太 多 ， 和 否则 汇 
集 各 层 的 处 理 开 销 太 大 。 


1. ISO/OSI 参考 模型 
IOS/OSI 的 参考 模型 共有 7 层 ， 如 图 5-3 所 示 。 由 低层 至 高 层 分 别 为 物理 层 、 数 据 链 路 层 、 


网 络 层 、 传 输 层 、 会 话 层 、 表 示 层 和 应 用 层 。 
协议 


应 用 层 应 用 层 
二 于 层 
A A 
1 人 
届 和 局 局 
2 到 
和 [| 和 
物理 介质 


图 5-3 OSI 参考 模型 


图 42 若 。 数据 库 系统 工程 师 教程 〈 第 3 版 ) 


OSI 参考 模型 各 层 的 功能 简 述 如 下 。 
OSI/RM 中 的 1 一 3 层 主 要 负责 通信 功能 ， 一 般 称 为 通信 子 


网 层 。 上 三 层 ( 即 5~7 层 ) 属 


于 资源 子 网 的 功能 范畴 ， 称 为 资源 子 网 层 。 传 输 层 起 着 衔接 上 下 三 层 的 作用 。 各 层 说 明 如 下 。 


(1) 物理 层 (Physical Layer)。 提 供 为 建立 、 维 护 和 拆除 物理 链 路 所 需 的 机 械 、 电 气 、 功 
E 和 规程 的 特性 ， 提 供 有 关 在 传输 介质 上 传输 非 结构 的 位 流 及 物理 链 路 故障 检测 指示 。 


户 要 传递 信息 就 要 利用 一 些 物理 媒体 ， 如 双 绞 线 、 同 轴 电 缆 等 ， 但 具体 的 物理 媒体 并 不 


在 OSI 的 7 层 之 内 ， 有 人 把 物理 媒体 当 作 第 0 层 ， 物 理 层 的 任务 就 是 为 它 的 上 一 层 提供 一 个 物 


理 连 接 ， 以 及 它们 的 机 械 、 电 气 、 功 能 和 过 程 特 性 。 如 规定 使 


上 电缆 和 接头 的 类 型 ， 传 送信 号 


的 电压 等 。 在 这 一 层 ， 数 据 还 没有 被 组 织 ， 仅 作为 原始 的 位 流 或 电气 电压 处 理 ， 单 位 是 位 。 
(2) 数据 链 路 层 (Data Link Layer)。 数 据 链 路 层 负责 在 两 个 相 邻 节点 间 的 线路 上 无 差错 地 


传送 以 帧 为 单位 的 数据 , 并 进行 流量 控制 。 每 一 帧 包括 一 定数 量 


的 数据 和 一 些 必要 的 控制 信息 。 


和 物理 层 相 似 ， 数 据 链 路 层 要 负责 建立 、 维 持 和 释放 数据 链 路 的 连接 。 在 传送 数据 时 ， 如 果 接 


收 点 检测 到 所 传 数据 中 有 差错 ， 就 要 通知 发 方 重 发 这 一 帧 。 


(3) 网 络 层 (Network Layer)。 为 传输 层 实 体 提供 端 到 端的 交换 网 络 数据 传送 功能 ， 使 得 
传输 层 摆脱 路 由 选择 、 交 换 方式 和 拥挤 控制 等 网 络 传输 细节 ; 可 以 为 传输 层 实体 建立 、 维 持 和 
拆除 一 条 或 多 条 通信 路 径 ， 对 网 络 传输 中 发 生 的 不 可 恢复 的 差错 予以 报告 。 

在 计算 机 网 络 中 进行 通信 的 两 个 计算 机 之 间 可 能 会 经 过 很 多 个 数据 链 路 ， 也 可 能 还 要 经 过 
很 多 通信 子 网 。 网 络 层 的 任务 就 是 选择 合适 的 网 间 路 由 和 交换 节点 ， 确 保 数 据 及 时 传送 。 网 络 


层 将 数据 链 路 层 提供 的 帧 组 成 数据 包 ， 包 中 封装 有 网 络 层 包头 ， 
站 点 和 目的 站 点 地 址 的 网 络 地 址 。 


其 中 含有 逻辑 地 址 信息 一 一 源 


(4) 传输 层 〈Transport Layer)。 为 会 话 层 实体 提供 透明 、 可 靠 的 数据 传输 服务 ， 保 证 端 到 


端的 数据 完整 性 ;选择 网 络 层 能 提供 最 适宜 的 服务 ， 提 供 建 立 、 


维护 和 拆除 传输 连接 功能 。 传 


输 层 根据 通信 子 网 的 特性 ， 最 佳 地 利用 网 络 资源 ， 为 两 个 端 系统 〈 也 就 是 源 站 和 目的 站 ) 的 会 


话 层 之 间 提 供 建 立 、 维 护 和 取消 传输 连接 的 功能 ， 并 以 可 靠 和 经 济 的 方式 传输 数据 。 在 这 一 层 ， 


信息 的 传送 单位 是 报 文 。 


(5) 会 话 层 (Session Layer)。 为 彼此 合作 的 表示 层 实 体 提 供 建立 、 维 护 和 结束 会 话 连 接 的 
功能 ;， 完 成 通信 进程 的 逻辑 名 字 与 物理 名 字 间 的 对 应 ; 提供 会 话 管 理 服务 。 

这 一 层 也 可 以 称 为 会 晤 层 或 对 话 层 ， 在 会 话 层 及 以 上 的 高 层次 中 ， 数 据 传送 的 单位 不 再 另 
外 命名 ， 统 称 为 报 文 。 会 话 层 不 参与 具体 的 传输 ， 它 提供 包括 访问 验证 和 会 话 管理 在 内 的 建立 
和 维护 应 用 之 间 通 信 的 机 制 。 如 服务 器 验证 用 户 登录 便 是 由 会 话 层 完成 的 。 

(6) 表示 层 (Presentation Layer)。 为 应 用 层 进程 提供 能 解释 所 交换 信息 含义 的 一 组 服务 
即将 欲 交 换 的 数据 从 适合 于 某 一 用 户 的 抽象 语法 转换 为 适合 于 OSI 系统 内 部 使 用 的 传送 语法 。 
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提供 格式 化 的 表示 和 转换 数据 服务 。 数 据 的 压缩 、 解 压缩 、 加 密 和 解密 等 工作 都 由 表示 层 负责 。 

(7) 应 用 层 (Application Layer)。 提 供 OSI 用 户 服务 ， 即 确定 进程 之 间 通 信 的 性 质 ， 以 满 
足 用 户 需要 以 及 提供 网 络 与 用 户 应 用 软件 之 间 的 接口 服务 。 例 如 ， 事 务 处理 程 序 、 电 子 邮件 和 
网 络 管理 程序 等 。 


2. 参考 模型 的 信息 流 据 


ISO/ OSI RM 内 信息 流动 如 图 5-4 所 示 。 设 A 系统 的 用 户 要 向 B 系统 的 用 户 传送 数据 。A 
系统 用 户 的 数据 先 送 入 应 用 层 ， 该 层 给 它 附加 控制 信息 AH 〈 头 标 ) 后 ， 送 入 表示 层 。 表 示 层 
对 数据 进行 必要 的 变换 并 加 头 标 PH 后 送 入 会 话 层 。 会 话 层 也 加 头 标 SH 送 入 传输 层 。 传 输 层 
将 长 报 文 分 段 后 并 加 头 标 TH 送 至 网 络 层 。 网 络 层 将 信息 变 成 报 文 分 组 ， 并 加 组 号 NH 送 数据 
链 路 层 。 数 据 链 路 层 将 信息 加 上 头 标 和 尾 标 (DH 及 DT) 变 成 帧 , 经 物理 层 按 位 发 送 到 对 方 (B 
系统 )。B 系统 接收 到 信息 后 ， 按 照 与 A 系统 相反 的 动作 ， 层 层 剥 去 控制 信息 ， 最 后 把 原 数据 
传送 给 B 系统 的 用 户 。 可 见 ， 两 系统 中 只 有 物理 层 是 实 通信 ， 而 其 余 各 层 均 为 虚 通信 。 因 此 ， 
图 5-4 中 只 有 两 物理 层 间 有 物理 连接 ， 其 余 各 层 间 均 无 连 线 。 


[ ^A 有 和] [一 ] 了 系统 
应 用 层 。 | 应 用 协议 一 [AH| 数据 | ”| ”应 用 层 
表示 层 | 表示 协议 ”一 [PH] 数 户 j= | 表示 层 
会 放 屋 | 会 话 协议 。 一 [56| 数据 | | 会 话 层 
传输 层 | 舍 输 协议 ”一 TH ” 弛 启 ” ”| | 传输 层 
网 络 层 。 | 网 络 协议 一 [NH] ”数据 茹 网 络 层 

数据 链 路 层 — [DH 数据 TD5T1。 | 数据 链 路 层 

| Ww | -mi | [| 。 物理 层 
一 


5-4 ISO/ OSI RM 内 信息 流动 


5.4 网 络 的 协议 与 标准 


计算 机 网 络 的 硬件 设备 是 承载 计算 机 通信 的 实体 , 但 它们 是 怎样 有 序 地 完成 计算 机 之 间 通 
信任 务 的 呢 ? 也 就 是 说 ， 要 共享 计算 机 网 络 的 资源 ， 以 及 进行 网 络 中 的 交换 信息 ， 就 需要 实现 
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5.4.1 


在 网 络 的 标准 化 方 重 
子 工业 协会 、 电 气 和 电子 了] 


网 络 的 标准 


1， 电信 标准 


1865 年 成 立 


为 联合 


到 


国 


， 有 许多 标准 化 机 构 丰 
[ 程 师 协会 、 因 特 网 活动 委员 会 等 。 


的 一 个 组 织 ， 它 由 如 下 三 部 分 组 成 。 


ITU-R: 无 线 通信 部 门 。ITU-R 的 主要 工作 是 确保 无 线 电 频 率 和 卫星 轨道 被 所 有 
平等 有效 和 经 济 地 利用 ,召开 世界 性 和 地 区 性 大 会 来 制定 无 线 电 法 规 和 地 


E 工 作 ， 如 国 


际 标准 化 组 织 、 国 


bh 实体 的 通信 。 两 个 实体 要 想 成 功 地 通信 ， 它 们 必须 具有 相同 的 语言 ， 在 计算 机 网 络 
中 称 为 协议 〈 或 规程 )。 所 谓 协 议 ， 指 的 是 网 络 中 的 计算 机 与 计算 机 进行 通信 时 ， 为 了 能 够 实 
现 数 据 的 正常 发 送 与 接收 ， 必 须要 遵循 的 一 些 事先 约定 好 的 规则 标准 或 约定 )， 在 这 些 规程 
中 明确 规定 了 通信 时 的 数据 格式 、 数 据 传送 时 序 以 及 相应 的 控制 信息 和 应 答 信号 等 内 容 。 下 面 
主要 介绍 网 络 的 标准 、 局 域 网 协议 与 广域网 协议 。 


际 电信 联盟 、 电 


际 电信 联盟 (International Telecommunication Union, ITU), 1947 年 ITU 成 


家 


起 草 并 通过 有 关 技 术 、 业 务 和 系统 的 建议 。 


ITU-T: 电信 标准 部 门 。 下 设 许多 研究 组 ， 研 究 组 下 设 专 题 ， 从 事 


区 性 协议 ， 


网 络 管理 、 网 络 维 


护 、 业 务 运 营 、 网 络 和 终端 的 端 对 端 传输 特性 、 网 络 总 体 方面 、 多 媒体 业务 和 系统 等 


廊下 


ITU-D: 开发 部 门 。 主 要 宗旨 是 促进 第 三 世界 国 


的 研究 。 例 如 ，Q42/SG VII 专门 研究 OSI 参考 模型 。 


家 的 电信 发 展 。 


1953 一 1993 年 ，ITU-T 被 称 为 CCITT 〈 国 际 电 报 电话 咨询 委员 会 )。CCITT 建议 自 1993 
年 起 都 打上 了 ITU-T 标记 。 已 经 公布 并 使 用 的 最 重要 的 标准 如 下 。 
(1)V 系列 ,ITU-T 提出 的 V 系 列 标 准 主要 是 针对 调制 解 调 器 的 标准 。 例 如 , V90 是 56Kb/s 
调制 解 调 器 的 标准 。 


(2) X 系 列 。ITU-T 提出 


2. 


1946 年 成 立 的 


X.1 一 X.39 标准 。 应 


它 规定 了 数据 包装 和 传送 的 协议 。 


X.40 一 X.199 标准 。 管 至 
国际 标准 


国际 标准 化 组 


网 络 结构 、 传 输 、 发 信号 等 。 


国际 标准 ，ISO 有 89 个 成 员 


的 和 系列 标准 是 应 用 于 广域网 的 ， 该 系列 标准 分 为 如 下 两 组 。 


上 于 终端 形式 、 接 口 、 服 务 设施 和 设备 。 最 著名 的 标准 是 X.25， 


国家 ，85 个 其 他 
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成 员 。 ISO 的 任务 是 促进 全 球 范 围 内 的 标准 化 及 其 有 关 活 动 ,以 利于 国际 间 产 品 与 服务 的 交流 ， 
以 及 在 知识 、 科 学 、 技 术 和 经 济 活动 中 发 展 国际 间 的 相互 合作 。 例 如 ，ISO 开发 了 开放 式 系统 
互连网 络 结构 模型 ， 模 型 定义 了 用 于 网 络 结构 的 7 个 数据 处 理 层 。 

其 他 标准 化 组 织 如 下 。 

(1) ANSI: 美国 国家 标准 研究 所 ，ISO 的 美国 代表 。ANSI 设计 了 ASCII 代码 组 ， 它 
是 一 种 广泛 使 用 的 数据 通信 标准 代码 。 

(2) NIST: 美国 国家 标准 和 技术 研究 所 ， 美 国 商业 部 的 标准 化 机 构 。 

(3) IEEE: 电气 和 电子 工程 师 协会 (Institute of Electrical and Electronics Engineers ) 。 
IEEE 设置 了 电子 工业 标准 ， 分 成 一 些 标准 委员 会 〈 或 工作 组 )， 每 个 工作 组 负责 标准 的 一 
个 领域 , 工作 组 802 设置 了 网 络 上 的 设备 如 何 彼此 通信 的 标准 , 即 IEEE 802 标准 委员 会 划 
分 成 的 工作 组 有 802.1 工作 组 ， 协 调 低档 与 高 档 OSI 模型 ，802.2 工作 组 , 涉及 逻辑 数据 链 
路 标准 ，802.3 工作 组 ， 有 关 CSMA/CD 标准 在 以 太 网 的 应 用 ，802.4 工作 组 ， 令 牌 总 线 标 
准 在 LAN 中 的 应 用 ; 802.5 工作 组 ， 设 置 有 关 令 牌 环 网 络 的 标准 。 

(4) EIA: 电子 工业 协会 (Electronic Industries Association )。 最 为 人 熟悉 的 EIA 标准 之 
一 是 RS-232C 接口 ， 这 一 通信 接口 允许 数据 在 设备 之 间 交 换 。 

值得 注意 的 是 ，ITU-T 和 ISO 之 间 有 很 好 的 合作 和 协调 。 


3. JInternet 标准 


Internet 标准 的 特点 是 自发 而 非 政 府 干预 的 ， 管 理 松散 ， 每 个 分 网 络 均 由 各 自分 别管 理 ， 目 前 
已 组 成 了 一 个 民间 性 质 的 协会 ISOC (Internet Society) 进行 必要 的 协调 与 管理 ， 有 一 个 网 络 信 
息 中 心 (NIC) 来 管理 IP 地址 ， 保 证 注册 地 址 的 唯一 性 ， 并 为 用 户 提供 一 些 文件 ， 介 绍 可 用 的 
服务 。ISOC 设 有 Internet 总 体 管理 机 构 结构 (IAB)。 

1969 年 ， 在 ARPANET 时 代 就 开始 发 布 请 求 评注 (Request For Comments，RFC)， 至 今 已 
超过 3000 个 。 


5.4.2 ”局域网 协议 


IEEE 局 域 网 标准 委员 会 对 局 域 网 的 定义 为 :“ 局 域 网 络 中 的 通信 被 限制 在 中 等 规模 的 地 理 
范围 内 ， 如 一 所 学 校 ， 能 够 使 用 具有 中 等 或 较 高 数据 速率 的 物理 信道 ， 且 具有 较 低 的 误 码 率 ; 
局 域 网 络 是 专用 的 ， 由 单一 组 织 机 构 所 使 用 。” 局 域 网 技术 由 于 具有 规模 小 、 组 网 灵活 和 结构 
规整 的 特点 ， 因 此 极 易 形 成 标准 。 事 实 上 ， 局 域 网 技术 也 是 在 所 有 计算 机 网 络 技术 中 标准 化 程 
度 最 高 的 一 部 分 .国际 电子 电气 工程 师 协议 早 在 20 世纪 70 年 代 就 制定 了 三 个 局 域 网 标准 :IEEE 
802.3 (CSMA/CD， 以 太 网 )、IEEE 802.4 (Token Bus， 令 牌 总 线 ) 和 IEEE 802.5 (Token Ring， 
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令 牌 环 )。 由 于 它 已 被 市 场 广泛 接受 , 因此 IEEE 802 系列 标准 已 被 ISO 采纳 为 国际 标准 。 而 且 ， 
随 着 网 络 技术 的 发 展 ， 又 出 现 了 IEEE 802.7 (FDDI)、IEEE 802.3u (快速 以 太 网 )、IEEE 802.12 
(100VG-AnyLAN) 和 IEEE 802.3z 〈 千 兆 以 太 网 ) 等 新 一 代 网 络 标准 。 

一 个 局 域 网 的 基本 组 成 主要 有 网 络 服务 器 、 网 络 工作 站 、 网 络 适 配器 和 传输 介质 。 这 些 设 
备 在 特定 网 络 软件 支持 下 完成 特定 的 网 络 功能 。 决 定局 域 网 特性 的 主要 技术 有 三 个 方面 : 用 以 


传输 数据 的 传输 介质 ， 用 以 连接 各 种 设备 的 拓扑 结构 ; 用 以 共享 资源 的 介质 访问 控制 方法 。 它 
们 在 很 大 程度 上 决定 了 传输 数据 的 类 型 、 网 络 的 响应 时 间 、 吞 吐 量 和 利用 率 ， 以 及 网 络 应 用 等 
各 种 网 络 特性 。 不 同 的 局 域 网 协议 最 重要 的 区 别 是 介质 访问 控制 方法 ， 它 对 网 络 特性 具有 十 分 
重要 的 影响 。 

1. LAN 模型 


ISO/OSI 的 7 层 参 考 模型 本 身 不 是 一 个 标准 , 在 制定 具体 网 络 协 议和 标准 时 , 要 依 OSIRM 
参考 模型 作为 “参照 基准 ” 并 说 明 与 该 “参照 基准 ”的 对 应 关系 。 在 IEEE 802 局 域 网 CLAN) 
标准 中 ， 只 定义 了 物理 层 和 数据 链 路 层 两 层 ， 并 根据 LAN 的 特点 ， 把 数据 链 路 层 分 成 逻辑 链 
路 控制 (Logical Link Control，LLC) 子 层 和 介质 访问 控制 (Medium Access Control，MAC ) 子 
层 。 还 加 强 了 数据 链 路 层 的 功能 ， 把 网 络 层 中 的 寻 址 、 排 序 、 流 控 和 差错 控制 等 功能 放 在 LLC 
子 层 来 实现 。 图 5-5 为 LAN 协议 的 层次 以 及 与 OSIRM 参考 模型 的 对 应 关系 。 


1 


OSI/RM 
高 屋 
传输 层 
网 络 层 LAN 
数据 链 路 层 逻辑 链 路 控制 层 
- 介质 访问 控制 层 
0 物理 层 


5-5 LAN 层次 与 OSIURM 的 对 应 关系 


) 物理 层 


和 OSI 物理 层 的 功能 一 样 ， 主 要 处 理 在 物理 链 路 上 发 送 、 传 递 和 接收 非 结 构 化 的 比特 流 ， 
包括 对 带宽 的 频道 分 配 和 对 基带 的 信号 调制 、 建 立 、 维 持 、 撤 销 物 理 链 路 ， 处 理 机 械 的 、 电 气 
的 和 过 程 的 特性 。 其 特点 是 可 以 采用 一 些 特殊 的 通信 媒体 ， 在 信息 组 成 的 格式 上 可 以 有 多 种 。 


2 


) MAC 
要 功能 是 控制 对 传输 介质 的 访问 ，MAC 与 网 络 的 具体 拓扑 方式 以 及 传输 介质 的 类 型 有 关 ， 
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主要 是 介质 的 访问 控制 和 对 信道 资源 的 分 配 。MAC 层 还 实现 帧 的 寻 址 和 识别 , 完成 帧 检测 序列 产 
生 和 检验 等 功能 。 

3) LLC 

可 提供 两 种 控制 类 型 ， 即 面向 连接 服务 和 非 连接 服务 。 其 中 ， 面 向 连接 服务 能 够 提供 可 靠 
的 信道 。 逻 辑 链 路 控制 层 提 供 的 主要 功能 是 数据 帧 的 封装 和 拆除 ， 为 高 层 提供 网 络 服务 的 逻辑 
接口 ， 能 够 实现 差错 控制 和 流量 控制 。 
在 计算 机 网 络 体系 结构 中 ， 最 具 代表 性 和 权威 的 是 ISO 的 OSURM 和 IEEE 的 802 协议 。 


OSI 是 设计 和 实现 网 络 协议 标准 的 最 重要 的 参考 模型 和 依据 , 而 IEEE 802 则 制定 了 一 系列 具体 
的 局 域 网 标准 ， 并 不 断 地 增加 新 的 标准 ， 它 们 之 间 的 关系 如 图 5-6 所 示 。 
802.1 体系 结构 及 网 络 互 连 
802.2 逻辑 链 路 控制 
802.3 802.4 和 802.12 物理 介质 


5-6 IEEE 802 标准 系列 间 的 关系 


2. 以 太 网 (IEEE 802.3 标准 ) 


以 太 网 技术 可 以 说 是 局 域 网 技术 中 历史 最 悠久 和 最 常用 的 一 种 。 它 采用 的 “ 存 取 方 法 ”是 
带 冲 突 检测 的 载波 监听 多 路 访问 协议 〈Carrier-Sense Multiple Access with Collision Detection， 
CSMA/CD) 技术 。 

目前 以 太 网 主要 包括 三 种 类 型 : IEEE 802.3 中 定义 的 标准 局 域 网 ， 速 度 为 10Mb/s， 传 输 介 
质 为 细 同 轴 电 缆 ; IEEE 802.3u 中 定义 的 快速 以 太 网 , 速度 为 100Mb/s, 传输 介质 为 双 绞 线 ; IEEE 
802.3z 中 定义 的 千 兆 以 太 网 ， 速 度 为 1000Mb/s， 传 输 介质 为 光纤 或 双 绞 线 。 

1) 介质 访问 技术 

IEEE 802.3 所 使 用 的 介质 访问 协议 CSMA/CD 是 让 整个 网 络 上 的 主机 都 以 竞争 的 方式 来 抢 
夺 传 送 数据 的 权力 。 工 作 过 程 为 : 首先 侦 听 信道 ， 如 果 信道 空间 ， 则 发 送 ， 如 果 信 道 忙 ， 则 继 
续 侦 听 , 直到 信道 空闲 时 立即 发 送 。 开 始 发 送 后 再 进行 一 段 时 间 的 检测 ,方法 是 边 发 送 边 接收 ， 
并 将 收 、 发 信息 相 比较 ， 若 结果 不 同 ， 表 明 发 送 的 信息 遇 到 碰撞 ， 于 是 立即 停止 发 送 ， 并 向 总 
线 上 发 出 一 串 阻 塞 信号 ， 通 知 信道 上 各 站 冲突 已 发 生 。 已 发 出 信息 的 各 站 收 到 阻塞 信号 后 ， 等 
待 一 段 随机 时 间 ， 等 待 时 间 最 短 的 站 将 重新 获得 信道 ， 可 重新 发 送 。 

在 CSMA/CD 中 ， 当 检测 到 冲突 并 发 出 阻塞 信号 后 ， 为 了 降低 再 次 冲突 概率 ， 需 要 等 待 一 
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个 退 避 时 间 。 退 避 算 法 有 许多 种 ， 常 用 的 一 种 通用 退 避 算法 称 为 二 进 制 指数 退 避 算法 。 

2) IEEE 802.3 一 一 10Mb/s 以 太 网 
EEE 802.3 一 一 10Mb/s 以 太 网 定义 过 10Base 5、10Base 2、10Base-T 和 10Base-F 等 几 种 
(需要 注 明 的 是 , 其 中 10Base-T 与 10Base-F 的 最 后 一 项 就 是 以 线 绕 类 型 进行 命名 的 , 其 中 了 T 代 
表 双 绞 线 , 代表 光纤 )。10Base 5 标准 是 最 早 的 媒体 规范 ， 它 使 用 阻抗 为 509 的 同 轴 粗 缆 。 但 
于 同 轴 粗 缆 的 缆 线 直 径 大 ， 所 以 比较 笨重 ， 不 易 铺 设 。10Base 2 标准 是 为 建立 一 个 比 10Base 5 
更 廉价 的 局 域 网 ， 它 使 用 阻抗 为 S0Q 的 同 轴 细 缆 ， 唯 一 的 差别 就 是 它 使 得 每 两 个 节点 间 的 距离 
恨 制 从 500m 降 为 185m。10Base-T 标准 是 一 个 使 用 非 屏蔽 双 绞 线 为 传输 介质 的 标准 , 所 要 用 到 
的 非 屏蔽 双 绞 线 只 需 3 类 线 标准 即 可 满足 要 求 ， 是 一 个 成 功 的 标准 。10Base-F 标准 充分 利用 了 
新 兴 媒 体 光纤 的 距离 长 、 传 输 性 能 好 的 优点 ， 大 大 改进 了 以 太 网 技术 。 

3) IEEE 802.3u 一 一 100Mb/s 快速 以 太 网 

随 着 计算 机 技术 的 不 断 发 展 , 10Mb/s 的 网 络 传输 速度 实在 无 法 满足 日 益 增 大 的 需求 。 IEEE 
802.3u 充分 考虑 到 了 向 下 兼容 性 : 它 采 用 了 非 屏蔽 双 绞 线 〈 或 屏蔽 双 绞 线 、 光 纤 ) 作为 传输 媒 
介 , 采用 与 IEEE 802.3 一 样 的 介质 访问 控制 层 一 CSMA/CD。 IEEE 802.3u 常 称 为 快速 以 太 网 。 
根据 实现 的 介质 不 同 ， 快 速 以 太 网 可 以 分 为 100BaseTX、100BaseFX 和 100BaseT4 三 种 。 

100BaseTX 用 两 对 5 类 非 屏 蔽 双 绞 线 ， 或 者 1 类 、2 类 屏蔽 双 绞 线 作 为 传输 媒介 ， 来 实现 
传输 速度 为 100Mb/s 的 网 络 ， 最 多 支持 两 个 中 继 器 。100BaseFX 是 2 束 多 模 光 纤 上 的 标准 ， 在 
没有 中 继 设 备 的 网 络 中 最 大 传输 距离 为 400m。100BaseT4 利用 10Mb/s 的 网 络 中 使 用 的 3 类 线 
有 两 对 是 空 着 没有 利用 的 特点 ， 使 用 4 对 3 类 非 屏蔽 双 绞 线 上 提供 传输 速度 为 100Mb/s 网 络 。 

4) IEEE 802.3z 一 一 1000Mb/s 千 兆 以 太 网 

IEEE 802.3z 对 介质 访问 控制 层 规范 进行 了 重新 定义 ， 以 维持 适当 的 网 络 传输 距离 ， 介 质 
访问 控制 方法 仍 采 用 CSMA/CD 协议 ， 并 且 重 新 制定 了 物理 层 标准 ， 使 之 能 提供 1000Mb/s 的 
原始 带宽 。 因 此 ， 它 仍 是 一 种 共享 介质 的 局 域 网 ， 发 送 到 网 上 的 信号 是 广播 式 的 ， 接 收 站 根据 
地 址 接收 信号 。 网 络 接口 硬件 能 监听 线路 上 是 否 已 存在 信号 ， 以 避免 冲突 ， 或 在 没有 冲突 时 重 
发 数据 。 
在 物理 层 ， 千 兆 以 太 网 支持 如 下 三 种 传输 介质 。 

(1) 光纤 系统 。 支 持 多 模 光 纤 和 单 模 光 纤 系 统 ， 多 模 光 纤 的 工作 距离 为 500m， 单 模 光 纤 
的 工作 距离 为 2000m。 

(2) 宽带 同 轴 电 绕 系统 。 其 传输 距离 为 23m。 

(3) 5 类 UTP 电缆 。 其 传输 距离 为 100m， 链 路 操作 模式 为 半 双 工 。 

千 兆 位 以 太 网 采用 以 交换 机 为 中 心 的 星 型 拓扑 结构 ， 主 要 用 于 交换 机 与 交换 机 之 间或 者 交 
换 机 与 企业 超级 服务 器 之 间 的 高 速 网 络 连接 。 
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3. 令 牌 环 网 (IEEE 802.5) 


令 牌 环 是 环 型 网 中 最 普遍 采用 的 介质 访问 控制 ， 它 适用 于 环 型 网 络 结构 的 分 布 式 介质 访问 
控制 ， 其 流行 性 仅 次 于 以 太 网 。 令 牌 环 网 的 传输 介质 虽然 没有 明确 定义 ， 但 主要 基于 屏蔽 双 绞 
线 和 非 屏蔽 双 绞 线 两 种 ， 拓 扑 结构 可 以 有 多 种 ， 如 环 型 〈 最 典型 )、 星 型 〈 采 用 得 最 多 ) 和 总 
线 型 (一 种 变形 )。 编 码 方法 为 差分 曼彻斯特 编码 。 

IEEE 802.5 的 介质 访问 使 用 的 是 令 牌 环 控制 技术 ， 其 工作 过 程 为 : 首先 ， 令 牌 环 网 在 网 络 
中 传递 一 个 很 小 的 帧 ， 称 为 “ 令 牌 ” 只 有 拥有 令 牌 环 的 工作 站 才 有 权力 发 送信 息 。 令 牌 在 网 
络 上 依次 顺序 传递 。 当 工作 站 要 发 送 数 据 时 ， 等 待 捕获 一 个 空 令 牌 ， 然 后 将 要 发 送 的 信息 附加 
到 后 边 ， 发 往 下 一 站 ， 如 此 直到 目标 站 。 然 后 将 令 牌 释放 。 如 果 工 作 站 要 发 送 数据 时 ， 经 过 的 
令 牌 不 是 空 的 ， 则 等 待 令 牌 释放 。 

当 信 息 帧 绕 环 通过 各 站 时 ， 各 站 都 要 将 帧 的 目的 地 址 与 本 站 地 址 相 比较 ， 如 果 地 址 符合 ， 
说 明 是 发 送 给 本 站 的 ， 则 将 帧 复制 到 本 站 的 接收 缓冲 器 中 ， 同 时 将 帧 送 回 到 环 上 ， 使 帧 继续 沿 
环 传送 ， 如 果 地 址 不 符合 ， 则 简单 地 将 信息 帧 重新 送 到 环 上 即 可 。 


4. FDDI 


FDDI (Fiber Distributed Data Interface， 光 纤 分 布 式 数据 接口 ) 类 似 令 牌 环 网 的 协议 ， 它 用 
光纤 作为 传输 介质 ， 数 据 传 速 可 达到 100Mb/s， 环 路 长 度 可 扩展 到 200km， 连 接 的 站 点 数 可 以 
达到 1000 个 。FDDI 采用 一 种 新 的 编码 技术 ， 称 为 4B/5B 编码 ， 即 每 次 对 4 位 数据 进行 编码 。 
每 4 位 数据 编码 成 5 位 符号 , 用 光 信 号 的 存在 或 不 存在 来 代表 5 位 符号 中 的 每 一 位 是 1 还 是 0。 

光纤 中 传送 的 是 光 信号 ， 有 光 脉 冲 表示 1， 无 光 脉 冲 表示 0。 这 种 简单 编码 的 缺点 是 没有 
同步 功能 。 在 同 轴 电 缆 或 双 绞 线 作为 传输 介质 的 局 域 网 中 ， 通 常 采用 曼彻斯特 编码 方式 。 它 利 
用 中 间 的 跳 变 作为 同步 信号 。 这 样 对 每 一 位 数据 单元 产生 两 次 瞬 变 ， 使 带宽 的 利用 率 降 低 。5 
位 编码 的 32 种 组 合 中 ， 实 际 只 使 用 了 24 种 ， 其 中 的 16 种 用 来 做 数据 ， 其 余 8 种 用 来 做 控制 
符号 〈 如 帧 的 起 始 和 结束 符号 等 )。4B/SB 编码 中 ，5 位 码 中 的 “1” 码 至 少 为 2 位 ， 按 NRZI 
编码 原理 ， 信 号 中 就 至 少 有 两 次 跳 变 ， 因 此 接收 端 可 得 到 足够 的 同步 信息 。 

FDDI 采用 双环 体系 结构 ， 两 环 上 的 信息 反方 向 流动 。 双 环 中 的 一 环 称 为 主 环 ， 另 一 环 称 
为 次 环 。 在 正常 情况 下 ， 主 环 传输 数据 ， 次 环 处 于 空闲 状态 。 双 环 设计 的 目的 是 提供 高 可 靠 性 
和 稳定 性 。 FDDI 定义 的 传输 介质 有 单 模 光 纤 和 多 模 光 纤 两 种 。 


5.4.3 广域网 协议 


广域网 通常 是 指 覆 盖 范 围 大 ， 传 输 速率 低 ， 以 数据 通信 为 主要 目的 的 数据 通信 网 。 随 着 信 
息 技术 的 迅速 发 展 ， 很 多 国家 的 数据 通信 业务 的 增长 率 已 大 大 提高 ， 特 别 是 国际 互联 网 的 普及 
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促进 了 数据 通信 网 技术 的 发 展 。 

在 地 域 分 布 很 远 、 很 分 散 ， 以 至 于 无 法 用 直接 连接 来 接 入 局 域 网 的 场合 ， 广 域 网 WAN) 
通过 专用 的 或 交换 式 的 连接 把 计算 机 连接 起 来 。 这 种 广 域 连接 可 以 是 通过 公众 网 建立 的 ， 也 可 
以 是 通过 服务 于 某 个 专门 部 门 的 专用 网 建立 起 来 。 相 对 来 说 ， 广 域 网 显得 比较 错综复杂 ， 目 前 
主要 用 于 广 域 传输 的 协议 比较 多 ， 如 PPP〈 点 对 点 协议 )、DDN、ISDN (综合 业务 数字 网 )、 
FR 〈 帧 中 继 ) 和 ATM (异步 传输 模式 ) 等 。 


1， 点 对 点 协议 (PPP) 


点 对 点 协议 主要 用 于 “拨号 上 网 ”这 种 广 域 连接 模式 。 它 的 优点 在 于 简单 、 具 备用 户 验证 
能 力 、 可 以 解决 下 分 配 等 。 它 主要 通过 拨号 或 专线 方式 建立 点 对 点 连接 发 送 数据 ， 使 其 成 为 各 
种 主机 、 网 桥 和 路 由 器 之 间 简 单 连接 的 一 种 共通 的 解决 方案 。 

家 庭 拨号 上 网 就 是 通过 PPP 在 用 户 端 和 运营 商 的 接 入 服务 器 之 间 建 立 通信 和 链 路 。 目 前 ， 宽 
带 接 入 正在 成 为 取代 拨号 上 网 的 趋势 ， 在 宽带 接 入 技术 日 新 月 异 的 今天 ，PPP 也 衍生 出 新 的 应 
用 。 典 型 的 应 用 是 在 ADSL (Asymmetrical Digital Subscriber Line， 非 对 称 数据 用 户 线 ) 接 入 方 
式 当 中 ，PPP 与 其 他 的 协议 共同 派生 出 了 符合 宽带 接 入 要 求 的 新 的 协议 ， 如 PPPoE 和 PPPoA。 

利用 以 太 网 (Ethernet) 资 源 , 在 以 太 网 上 运行 PPP 来 进行 用 户 认 证 接 入 的 方式 称 为 PPPoE 。 
PPPoE 既 保护 了 用 户 方 的 以 太 网 资源 ， 又 完成 了 ADSL 的 接 入 要 求 , 是 目前 ADSL 接 入 方式 中 
应 用 最 广泛 的 技术 标准 。 同样 ， 在 ATM 网 络 上 运行 PPP 来 管理 用 户 认证 的 方式 称 为 PPPoA。 
它 与 PPPoE 的 原理 相同 ， 作 用 相同 。 不 同 的 是 ， 它 是 在 ATM 网 络 上 ， 而 PPPoE 是 在 以 太 网 网 
络 上 运行 ， 所 以 要 分 别 适 应 ATM 标准 和 以 太 网 标准 。 


2. 数字 用 户 线 (xDSL) 


xDSL 是 各 种 数字 用 户 线 的 统称 , 根据 各 种 宽带 通信 业务 需要 , 目前 还 有 DSL 技术 和 产品 ， 
如 ADSL (Asymmetric DSL， 不 对 称 数 字 用 户 线 ) 、SDSL (Single pair DSL， 单 对 线 数字 用 户 
环 路 ) 、IDSL (ISDN DSL，ISDN 用 的 数字 用 户 线 ) 、RADSL (Rate adaptive DSL， 速 率 自 适 
应 非 对 称 型 数字 用 户 线 ) 和 VDSL (Very high Bit rate DSL， 甚 高 速 数字 用 户 线 ) 等 。 

ADSL 是 研制 最 早 ， 发 展 较 快 的 一 种 。 它 是 在 一 对 铜 双 绞 线 上 为 用 户 提供 上 、 下 行 非 对 称 
的 传输 速率 〈 即 带宽 ) 。ADSL 接 入 服务 能 做 到 较 高 的 性 能 价格 比 ，ADSL 接 入 技术 较 其 他 接 
入 技术 具有 其 独特 的 技术 优势 : 它 的 速率 可 达到 上 行 1 兆 /下 行 8 兆 ， 速 度 非常 快 。 另外， 使 用 
ADSL 上 网 不 需要 占用 电话 线路 ， 在 电话 和 上 网 互 不 干扰 的 同时 ， 大 大 节省 了 普通 上 网 方式 的 
话费 支出 ， 独 享 带 宽 安全 可 靠 ， 安 装 快捷 方便 ， 价格 实惠 。 它 把 线路 按 频段 分 成 语音 、 上 行 和 
下 行 三 个 信道 ， 故 语音 和 数据 可 共用 1 对 线 。ADSL 特别 适合 于 像 VOD 业务 及 Internet 和 多 媒 
体 业 务 的 应 用 。ADSL 一 般 采 用 CAP 和 DMT 两 种 线路 编码 调制 技术 。 传 输 距 离 与 线 径 、 速 率 
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有 关 ， 一 般 在 3km 以 上 。 因 此 ，ADSL 是 一 种 很 有 发 展 前 途 的 数字 接 入 技术 。ADSL 技术 作为 
一 种 宽带 接 入 方式 ， 可 以 为 用 户 提供 中 国电 信 宽 带 网 的 所 有 应 用 业务 。 采 用 各 种 拨号 方式 上 
网 的 用 户 将 逐步 过 渡 到 ADSL 宽带 接 入 方式 。ADSL 在 宽带 接 入 中 已 经 扮演 着 越 来 越 重要 的 
角色 。 
对 于 个 人 用 户 ， 在 现 有 电话 线 上 安装 ADSL， 只 需 在 用 户 端 安装 一 台 ADSL Modem 和 一 
只 分 离 器 ， 用 户 线路 不 用 任何 改动 ， 极 其 方便 。 数 据 线路 为 : PC 一 ADSL Modem 一 分 离 器 一 入 
户 接线 盒 一 电话 线 一 DSL 接 入 复 用 器 一 ATM/IP 网 络 ; 语音 线路 为 : 话机 一 分 离 器 一 入 户 接线 
盒 一 电话 线 一 DSL 接 入 复 用 器 一 交换 机 。 

对 于 企业 用 户 , 在 现 有 电话 线 上 安装 ADSL 和 分 离 器 , 连接 HUB 或 Switch。 数 据 线路 为 : 
PC 一 以 太 网 (HUB 或 Switch) 一 ADSL 路 由 器 一 分 离 器 一 入 户 接线 盒 一 电话 线 一 DSL 接 入 复 
用 器 一 ATMVIP 网 络 ;语音 线路 为 : 话机 一 分 离 器 一 入 户 接线 盒 一 电话 线 一 DSL 接 入 复 用 器 
交换 机 。 


3， 数字 专 线 


数字 数据 网 (Digital Data Network，DDN) 是 采用 数字 传输 信道 传输 数据 信号 的 通信 网 ， 
可 提供 点 对 点 、 点 对 多 点 透明 传输 的 数据 专线 出 租 电路 ， 为 用 户 传输 数据 、 图 像 和 声音 等 信息 。 
数字 数据 网 是 以 光纤 为 中 继 干线 网 络 ， 组 成 DDN 的 基本 单位 是 节点 ， 节 点 间 通 过 光纤 连接 ， 
构成 网 状 的 拓扑 结构 。 

DDN 专线 就 是 市 内 或 长 途 的 数据 电路 ， 电 信 部 门将 它们 出 租 给 用 户 做 资料 传输 使 用 后 ， 它 们 
就 变 成 用 户 的 专线 ， 直 接 进入 电信 的 DDN 网 络 ， 因 为 这 种 电路 是 采用 固定 连接 的 方式 ， 不 需 
经 过 交换 机 房 ， 所 以 称 之 为 固定 DDN 专线 。DDN 专线 不 仅 需 要 铺设 专用 线路 〈 在 DDN 的 客 
户 端 需要 一 个 称 为 DDN Modem 的 CSU/DSU 设备 以 及 一 个 路 由 器 ) 从 用 户 端 进入 主干 网 络 ， 
而 且 需 要 付 电 信和 月 租 费 、 网 络 使 用 费 和 电路 租用 费 等 。 其 优势 是 网 络 传输 速率 高 、 时 延 小 、 质 
量 好 、 网 络 透明 度 高 、 可 支持 任何 规程 、 安 全 可 靠 。 


4. X.25 协议 


X.25 在 本 地 DTE 和 远程 DTE 之 间 提 供 一 个 全 双 工 、 同 步 的 透明 信道 ， 并 定义 了 三 个 相互 
独立 的 控制 层 : 物理 层 、 数 据 链 路 层 和 分 组 层 ， 它 们 分 别 对 应 于 ISO/OSI 的 物理 层 、 链 路 层 和 
网 络 层 ， 如 图 5-7 所 示 。 

X.25 是 在 公用 数据 网 上 ， 以 分 组 方式 进行 操作 的 DTE 〈 数 据 终端 设备 ) 和 DCE (数据 通 
信 设 备 ) 之 间 的 接口 。X.25 只 是 对 公用 分 组 交换 网 络 的 接口 规范 说 明 , 并 不 涉及 网 络 内 部 实现 ， 
它 是 面向 连接 的 ， 支 持 交 换 式 虚 电路 和 永久 虚 电 路 。 

物理 层 接口 指 DTE 和 网 络 之 间 的 线路 连接 ，X.25 指出 可 采用 V24、V35、G703 和 X.21 
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等 接口 ， 链 路 层 逻 辑 接口 采用 链 路 层 协议 ， 负 责 DTE 和 DCE 之 间 的 初始 化 、 校 验 ， 并 控制 物 
理 链 路 上 的 数据 传输 ， 用 户 数据 以 信息 帧 在 DTE 和 DCE 之 间 传 送 ， 分 组 层 罗 辑 接口 描述 了 呼 
叫 的 建立 、 保 持 和 拆除 的 过 程 ， 以 及 数据 和 控制 信息 在 分 组 中 的 格式 。 而 默认 的 数据 分 组 长 度 
是 128 个 字 节 。 


运程 用 户 进程 


多 重信 道 接口 


数据 链 路 层 | 数据 链 路 接口 


物理 层 物理 层 接口 


图 5-7 X.25 层次 模型 


5.4.4 TCP/IP 协议 簇 


TCP/IP 作为 Internet 的 核心 协议 ， 通 过 近 20 多 年 的 发 展 已 日 渐 成 熟 ， 并 被 广泛 应 用 于 局 
域 网 和 广域网 中 ， 目 前 已 成 为 事实 上 的 国际 标准 。 作 为 一 个 最 早 的 、 也 是 迄今 为 止 发 展 最 为 成 
熟 的 互联 网 络 协议 系统 ，TCP/PP 包含 许多 重要 的 基本 特性 ， 这 些 特 性 主要 表现 在 5 个 方面 : 进 
辑 编 址 、 路 由 选择 、 域 名 解析 、 错 误 检 测 和 流量 控制 以 及 对 应 用 程序 的 支持 等 。 

(1) 逻辑 编 址 。 每 一 块 网 卡 在 出 厂 时 就 由 厂家 分 配 了 一 个 独一无二 的 永久 性 的 物理 地 址 。 
在 Internet 中 ， 为 每 台 连 入 因特网 的 计算 机 分 配 一 个 逻辑 地 址 ， 这 个 逻辑 地 址 被 称 为 IP 地 址 。 
一 个 IP 地 址 可 以 包括 一 个 网 络 ID 号 ， 用 来 标识 网 络 ， 一 个 子 网 络 ID 号 ， 用 来 标识 网 络 上 的 
一 个 子 网 ， 另 外 ， 还 有 一 个 主机 ID 号 ， 用 来 标识 子 网 络 上 的 一 台 计 算 机 。 这 样 ， 通 过 这 个 分 
配给 某 台 计算 机 的 他 地 址 ， 就 可 以 很 快 地 找到 相应 的 计算 机 。 

(2) 路 由 选择 。 在 TCP/IP 中 包含 了 专门 用 于 定义 路 由 器 如 何 选择 网 络 路 径 的 协议 ， 即 人 
数据 包 的 路 由 选择 。 

(3) 域名 解析 。 虽 然 TCP/IP 采用 的 是 32 位 的 人 P 地 址 ， 但 考虑 用 户 的 记忆 方便 ， 专 门 设 
计 了 一 种 方便 的 字母 式 地 址 结构 ， 称 为 域名 或 DNS (域名 服务 ) 名 字 。 将 域名 映射 为 PP 地 址 
的 操作 ， 称 为 域名 解析 。 域 名 具有 较 稳 定 的 特点 ， 而 IP 地 址 则 较 易 发 生变 化 。 

(4) 错误 检测 与 流量 控制 。TCP/IP 具有 分 组 交换 确保 数据 信息 在 网 络 上 可 靠 传递 的 特性 ， 
这 些 特性 包括 检测 数据 信息 的 传输 错误 〈 保 证 到 达 目 的 地 的 数据 信息 没有 发 生变 化 )， 确 认 已 
传递 的 数据 信息 已 被 成 功 地 接收 ， 监 测 网 络 系统 中 的 信息 流量 ， 防 止 出 现 网 络 拥塞 。 
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1. TCP/IP 分 层 模型 


协议 是 对 数据 在 计算 机 或 设备 之 间 传 输 时 的 表示 方法 进行 定义 和 描述 的 标准 。 协 议 规 定 了 
进行 传输 、 检 测 错误 以 及 传送 确认 信息 等 内 容 。TCP/IP 是 个 协议 簇 , 它 包 含 了 多 种 协议 .ISO/OSI 
模型 、TCP/IP 的 分 层 模 型 及 协议 的 对 比如 图 5-8 所 示 。 

从 图 5-8 可 知 ，TCP/IP 分 层 模型 由 4 个 层次 构成 ， 即 应 用 层 、 传 输 层 、 网 际 层 和 网 络 接口 
层 ， 各 层 的 功能 简 述 如 下 。 

(1) 应 用 层 。 应 用 层 处 在 分 层 模型 的 最 高 层 ， 用 户 调用 应 用 程序 来 访问 TCP/IP 互联 网 络 ， 
以 享受 网 络 上 提供 的 各 种 服务 。 应 用 程序 负责 发 送 和 接收 数据 。 每 个 应 用 程序 可 以 选择 所 需要 
的 传输 服务 类 型 ， 并 把 数据 按照 传输 层 的 要 求 组 织 好 ， 再 向 下 层 传送 ， 包 括 独立 的 报 文 序列 和 
连续 字 节 流 两 种 类 型 。 

(2) 传输 层 。 传 输 层 的 基本 任务 是 提供 应 用 程序 之 间 的 通信 服务 。 这 种 通信 又 叫 端 到 端的 
通信 。 传 输 层 既 要 系统 地 管理 数据 信息 的 流动 ， 还 要 提供 可 靠 的 传输 服务 ， 以 确保 数据 准确 而 
有 序 地 到 达 目 的 地 。 为 了 这 个 目的 ， 传 输 层 协议 软件 需要 进行 协商 ， 让 接收 方 回 送 确认 信息 及 
让 发 送 方 重 发 丢失 的 分 组 。 在 传输 层 与 网 际 层 之 间 传 递 的 对 象 是 传输 层 分 组 。 

ISO/OSI 模 型 TCP/IP 协议 TCP/IP 模型 


应 用 层 | 文件 传输 | 远程 登录 | 电子 邮件 | 网 络 文件 服 | 网 络 管理 


协议 协议 协议 协议 应 用 层 
表示 层 (FTP) | (Telnet) | (SMTP) (SNMP) 
会 话 层 
传输 层 TCP UDP 传输 层 
网 络 层 PP ICMP ARP RARP 网 际 层 
数据 链 路 层 Ethernet Token-Ring/ 网 络 接口 层 
| 一 一 一 下 IEEE8023| FDDI | IEEE 802.5 | ARCnet | PPP/SLIP 
物理 层 硬件 层 


图 5-8 ”TCP/IP 模型 与 OSI 模型 的 对 比 


(3) 网 际 层 。 网 际 层 又 称 亿 层 ， 主 要 处 理 机 器 之 间 的 通信 问题 。 它 接收 传输 层 请 求 ， 传 送 某 
个 具有 目的 地 址 信息 的 分 组 。 该 层 主要 完成 如 下 功能 。 

Q@ 把 分 组 封装 到 人 ?数据 报 (IP Datagram) 中 ， 填 入 数据 报 的 首部 (也 称 为 报头 )， 使 用 
路 由 算法 选择 把 数据 报 直接 送 到 目标 机 或 把 数据 报 发 送 给 路 由 器 ， 然 后 再 把 数据 报 交 给 下 面 的 
网 络 接口 层 中 对 应 的 网 络 接口 模块 。 


国 :54 医 。 数据库 系统 工程 师 教程 (第 3 版 ) 


@ 处 理 接收 到 的 数据 报 ， 检 验 其 正确 性 。 使 用 路 由 算法 来 决定 是 在 本 地 进行 处 理 ， 还 是 
继续 向 前 发 送 。 如 果 数 据 报 的 目标 机 处 于 本 机 所 在 的 网 络 ， 该 层 软件 就 把 数据 报 的 报头 剥 去 ， 
再 选择 适当 的 传输 层 协议 软件 来 处 理 这 个 分 组 。 

@ 适时 发 出 ICMP 的 差错 和 控制 报 文 ， 并 处 理 收 到 的 ICMP 报 文 。 

(4) 网 络 接口 层 。 网 络 接口 层 又 称 数据 链 路 层 ， 处 于 TCP/IP 协议 层 之 下 ， 负 责 接收 人 P 数 
据 报 ， 并 把 数据 报 通过 选 定 的 网 络 发 送出 去 。 该 层 包含 设备 驱动 程序 ， 也 可 能 是 一 个 复杂 的 使 
用 自己 的 数据 链 路 协议 的 子 系统 。 


2. 网络 接 口 层 协议 


TCP/IP 协议 不 包含 具体 的 物理 层 和 数据 链 路 层 , 只 定义 了 网 络 接口 层 作为 物理 层 与 网 络 层 
的 接口 规范 。 这 个 物理 层 可 以 是 广域网 , 如 X.25 公用 数据 网 ; 可 以 是 局 域 网 , 如 Ethernet、 Token- 
Ring 和 FDDI 等 .任何 物理 网 络 只 要 按照 这 个 接口 规范 开发 网 络 接口 驱动 程序 , 都 能 够 与 TCP/IP 
协议 集成 起 来 。 网 络 接口 层 处 在 TCP/IP 协议 的 最 底层 ， 主 要 负责 管理 为 物理 网 络 准备 数据 所 
需 的 全 部 服务 程序 和 功能 。 


3， 网 际 层 协 议 了 


网 际 层 是 整个 TCP/IP 协议 簇 的 重点 。 在 网 际 层 定义 的 协议 除了 IP 外， 还 有 ICMP、ARP 
和 RARP 等 儿 个 重要 的 协议 。 

IP 所 提供 的 服务 通常 被 认为 是 无 连接 的 〈Connectionless) 和 不 可 靠 的 (Unreliable)。 事 实 
上 , 在 网 络 性 能 良好 的 情况 下 , IP 传送 的 数据 能 够 完好 无 损 地 到 达 目 的 地 。 所 谓 无 连接 的 传输 ， 
是 指 没 有 确定 目标 系统 在 已 做 好 接收 数据 准备 之 前 就 发 送 数据 。 与 此 相对 应 的 就 是 面向 连接 的 
(Connection Oriented) 传输 (如 TCP)， 在 该 类 传输 中 ， 源 系统 与 目的 系统 在 应 用 层 数 据 传送 之 
前 需要 进行 三 次 握手 。 至 于 不 可 靠 的 服务 ， 是 指 目的 系统 不 对 成 功 接收 的 分 组 进行 确认 ， 卫 只 
是 尽 可 能 地 使 数据 传输 成 功 。 但 是 只 要 需要 ， 上 层 协议 必须 实现 用 于 保证 分 组 成 功 提供 的 附加 
服务 。 


由 于 卫 只 提供 无 连接 、 不 可 靠 的 服务 ， 所 以 把 差错 检测 和 流量 控制 之 类 的 服务 授权 给 了 
其 他 的 各 层 协 议 ， 这 正 是 TCP/IP 能 够 高 效率 工作 的 一 个 重要 保证 。 这 样 ， 可 以 根据 传送 数据 
的 属性 来 确定 所 需 的 传送 服务 以 及 客户 应 该 使 用 的 协议 。 例如， 传送 大 型 文件 的 FTP 会 话 就 需 
要 面向 连接 的 、 可 靠 的 服务 (因为 如 果 稍 有 损坏 ， 就 可 能 导致 整个 文件 无 法 使 用 )。 

IP 的 主要 功能 包括 将 上 层 数据 (如 TCP、UDP 数据 ) 或 同 层 的 其 他 数据 (如 ICMP 数据 ) 
封装 到 IP 数据 报 中 ; 将 卫 数据 报 传送 到 最 终 目的 地 ;为 了 使 数据 能 够 在 链 路 层 上 进行 传输 ， 


对 数据 进 


同一 个 网 
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行 分 段 ， 确定 数据 报到 达 其 他 网 络 中 的 目的 地 的 路 径 。 


JP 协议 软件 的 工作 流程 : 当 发 送 数据 时 ， 源 计算 机 上 的 IP 协议 软件 必须 确定 目的 地 是 在 


据 到 达 的 目的 地 。 名 
远程 的 其 他 网 络 。 如 果 目 的 地 在 本 地 ,那么 人 P 协议 软件 就 启动 直达 通信 ; 如 果 目 的 地 是 远程 计 
算 机 ， 那 么 IP 必须 通过 网 关 (或 路 由 器 ) 进行 通信 ， 在 大 多 数 情 况 下 ， 这 个 网 关 应 当 是 默认 网 
关 。 当 源 卫 完成 了 数据 报 的 准备 工作 时 ， 它 就 将 数据 报 传递 给 网 络 访问 层 ， 网 络 访问 层 再 将 数 
据 报 传送 给 传输 介质 ， 最 终 完 成 数据 帧 发 往 目的 计算 机 的 过 程 。 

当 数 据 抵达 目的 计算 机 时 ， 网 络 访问 层 首先 接收 该 数据 。 网 络 访问 层 要 检查 数据 帧 有 无 错 
误 ， 并 将 数据 帧 送 往 正确 的 物理 地 址 。 假 如 数据 帧 到 达 目 的 地 时 正确 无 误 ， 网 络 访问 层 便 从 数 
据 帧 的 其 余部 分 中 提取 数据 有 效 负载 (Payload)， 然 后 将 它 一 直 传送 到 帧 层次 类 型 域 指定 的 协 
议 。 在 这 种 情况 下 ， 可 以 说 数据 有 效 负载 已 经 传递 给 了 卫 。 

有 关 人 ?地址 的 具体 情况 参见 5.5.2 节 的 内 容 。 


4. ARP 和 RARP 


网 际 层 中 的 另 一 个 重要 协议 , ARP 的 作用 是 将 瑟 地 址 转换 为 物理 地 址 , RARP 的 作用 是 将 物理 
地 址 。 网 络 中 的 任何 设备 ， 主 机 、 路 由 器 和 交换 机 等 均 有 唯一 的 物理 地 址 ， 该 地 
HH， 每 个 网 卡 出 厂 后 都 有 不 同 的 编号 ， 这 意味 着 用 户 所 购买 的 网 卡 有 着 唯一 的 物 


地 址 转换 为 卫 
址 通过 网 卡 给 


络 上 ， 还 是 在 另 一 个 网 络 上 。JP 通过 执行 这 两 项 计算 并 对 结果 进行 比较 ， 才 能 确定 数 


果 两 项 计算 的 结果 相同 ， 则 数据 的 目的 地 确定 为 本 地 ; 否则， 目的 地 应 为 


地 址 解析 协议 (Address Resolution Protocol，ARP) 及 反 地 址 解析 协议 (RARP) 是 驻 留 在 


理 地 址 。 另 一 方面 ， 为 了 屏蔽 底层 协议 及 物理 地 址 上 的 差异 ，IP 协议 又 使 用 了 IP 地 址 ， 因 此， 


在 数据 传输 过 程 中 ， 必 须 对 IP 地 址 与 物理 地 址 进行 相互 转换 。 


的 物理 地 址 ， 


的 【=P 


网 卡 


用 ARP 进行 IP 地 址 到 物理 地 址 转换 的 过 程 为 ， 当 计算 机 需要 与 任何 其 他 的 计算 机 进行 通 
信 时 ， 首 先 需 要 查询 ARP 高 速 缓存 ， 如 果 ARP 高 速 缓存 中 这 个 人 P 地 址 存在 ， 便 使 用 与 它 对 应 


地 址 相 一 致 , 习 


直接 将 数据 报 发 送 给 所 需 的 物理 网 卡 ; 如 果 ARP 高 速 缓存 中 没有 该 耻 地 址 ， 那 
么 ARP 便 在 局 域 网 上 以 广播 方式 发 送 一 个 ARP 请 求 包 。 如 果 局 域 网 上 I 地 址 与 某 台 计算 机 中 


bP 么 该 计算 机 便 生成 一 个 ARP 应 答 信息 , 信息 中 包含 对 应 的 物理 地 址 。 ARP 


协议 软件 将 人 * 地 址 与 物理 地 址 的 组 合 添加 到 它 的 高 速 缓存 中 ， 这 时 即 可 开始 数据 通信 。 
RARP 负责 物理 地 址 到 IP 地 址 的 转换 。 这 主要 用 于 无 盘 工 作 站 上 , 网 络 上 的 无 盘 工 作 站 在 


上 有 自己 的 物理 


地 址 ， 但 无 一 地 址 ， 因 此 必须 有 一 个 转换 过 程 。 为 了 完成 这 个 转换 过 程 ， 


网 络 中 


Ph 有 一 个 RARP 服务 器 ， 网 络 管理 员 事先 必须 把 网 卡 上 的 IP 地 址 和 相应 的 物理 地 址 存储 


到 IP RARP 服务 器 的 数据 库 中 。 
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5. 网 际 层 协议 ICMP 


Internet 控制 信息 协议 (Internet Control Message Protocol，ICMP) 是 网 际 层 的 另 一 个 比较 
重要 的 协议 。 由 于 卫 是 一 种 尽力 传送 的 通信 协议 ， 即 传送 的 数据 报 可 能 丢失 、 重 复 、 延 迟 或 乱 
序 ， 因 此 人 P 需要 一 种 避免 差错 并 在 发 生 差错 时 报告 的 机 制 。ICMP 就 是 一 个 专门 用 于 发 送 差错 
报 文 的 协议 。ICMP 定义 了 5 种 差错 报 文 〈 源 抑制 、 超 时 、 目 的 不 可 达 、 重 定向 和 要 求 分 段 ) 
和 4 种 信息 报 文 〈 回 应 请 求 、 回 应 应 答 、 地 址 屏蔽 码 请 求 和 地 址 屏蔽 码 应 答 )。 了 P 在 需要 发 送 
一 个 差错 报 文 时 要 使 用 ICMP， 而 ICMP 也 是 利用 人 P 来 传送 报 文 的 。ICMP 是 让 IP 更 加 稳固 、 
有 效 的 一 种 协议 ， 它 使 得 人 P 传送 机 制 变 得 更 加 可 靠 。 而 且 利 用 ICMP 还 可 以 用 于 测试 因特网 ， 
以 得 到 一 些 有 用 的 网 络 维护 和 排 错 的 信息 。 例如， 著名 的 ping 工具 就 是 利用 ICMP 报 文 进行 目 
标 是 否 可 达 测 试 。 


6， 传 输 层 协议 TCP 


TCP 〈Transmission Control Protocol， 传 输 控制 协议 )， 是 整个 TCP/IP 协议 族 中 最 重要 的 协 
议 之 一 。 它 在 卫 提供 的 不 可 靠 数据 服务 的 基础 上 , 为 应 用 程序 提供 了 一 个 可 靠 的 、 面 向 连接 的 、 
全 双 工 的 数据 传输 服务 。 

TCP 是 如 何 实现 可 靠 性 的 呢 ? 最 主要 和 最 重要 的 是 TCP 采用 了 一 个 叫 重 发 (Retransmission ) 
的 技术 。 具 体 来 说 ， 在 TCP 传输 过 程 中 ， 发 送 方 启动 一 个 定时 器 ， 然 后 将 数据 包 发 出 ， 当 接收 
方 收 到 了 这 个 信息 就 给 发 送 方 一 个 确认 (Acknowledgement) 信息 。 而 如 果 发 送 方 在 定时 器 到 
点 之 前 没收 到 这 个 确认 信息 ， 就 重新 发 送 这 个 数据 包 。 

利用 TCP 在 源 主机 想 和 目的 主机 之 间 建 立 和 关闭 连接 操作 时 ， 均 需要 通过 三 次 握手 来 确 
认 建立 和 关闭 是 否 成 功 。 三 次 握手 方式 如 图 5-9 所 示 ， 它 通过 “序号 /确认 号 ”使 得 系统 正常 工 
作 ， 从 而 使 它们 的 序号 达成 同步 。TCP 建立 连接 的 三 次 握手 过 程 如 下 。 


Q SYN SEQ=200 


@® ACK 201, SYN SEQ=350 


图 ACK 351 


图 5-9 TCP 建立 连接 的 “三 次 握手 ”过 程 


(1) 源 主 机 发 送 一 个 SYN〈 同 步 ) 标志 位 为 1 的 TCP 数据 包 ， 表 示 想 与 目标 主机 进行 通 
信 ， 并 发 送 一 个 同步 序列 号 〈 如 SEQ=200) 进行 同步 。 
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(2) 目标 主机 愿意 进行 通信 ， 则 响应 一 个 确认 (ACK 位置 1)。 并 以 下 一 个 序列 号 为 参考 
进行 确认 《如 201)。 

(3) 源 主机 以 确认 来 响应 目标 主机 的 TCP 包 。 这 个 确认 中 包括 它 想 要 接收 的 下 一 个 序列 
号 (该 帧 可 以 含有 发 送 的 数据 )。 至 此 连接 建立 完 
同样 ， 关 闭 连 接 也 进行 三 次 握手 。 


7. 传输 层 协 议 UDP 


户 数据 报 协议 〈User Datagram Protocol，UDP) 是 一 种 不 可 靠 的 、 无 连接 的 协议 ， 可 以 
保证 应 用 程序 进程 间 的 通信 。 与 同样 处 在 传输 层 的 面向 连接 的 TCP 相 比较 ，UDP 是 一 种 无 连 
接 的 协议 ， 它 的 错误 检测 功能 要 弱 得 多 。 可 以 这 样 说 ，TCP 有 助 于 提供 可 靠 性 ， 而 UDP 则 有 
助 于 提高 传输 的 高 速率 性 。 例如， 必须 支持 交互 式 会 话 的 应 用 程序 (如 FTP 等 ) 往往 使 用 TCP; 
而 自己 进行 错误 检测 或 不 需要 错误 检测 的 应 用 程序 (如 DNS、SNMP 等 ) 则 往往 使 用 UDP。 
UDP 协议 软件 的 主要 作用 就 是 将 UDP 消息 展示 给 应 用 层 ， 它 并 不 负责 重新 发 送 丢 失 的 或 
错 的 数据 消息 ， 不 对 接收 到 的 无 序 卫 数据 报 重 新 排序 ， 不 消除 重复 的 IP 数据 报 ， 不 对 已 收 
到 数据 报 进行 确认 ， 也 不 负责 建立 或 终止 连接 。 而 这 些 问 题 是 由 使 用 UDP 进行 通信 的 应 用 程 
序 负责 处 理 的 问题 。 
TCP 虽然 提供 了 一 个 可 靠 的 数据 传输 服务 ， 但 它 是 以 牺牲 通信 量 来 实现 的 。 也 就 是 说 ， 为 
完成 同样 一 个 任务 ，TCP 会 需要 更 多 的 时 间 和 通信 量 。 这 在 网 络 不 可 靠 的 时 候 ， 通 过 牺牲 一 些 
时 间 换 来 达到 网 络 的 可 靠 ， 但 当 网 络 十 分 可 靠 的 情况 下 ， 它 又 通过 浪费 带宽 来 保证 可 靠 性 ， 这 
时 UDP 则 以 十 分 小 的 通信 和 量 浪费 占据 优势 。 


8. 应 用 层 协议 


随 着 计算 机 网 络 的 广泛 应 用 ， 人 们 也 已 经 有 了 许多 基本 的 、 相 同 的 应 用 需求 。 为 了 让 不 
平台 的 计算 机 能 够 通过 计算 机 网 络 获得 一 些 基本 的 、 相 同 的 服务 ， 也 就 应 运 而 生 了 一 系列 应 用 
级 的 标准 ， 实 现 这 些 应 用 标准 的 专用 协议 被 称 为 应 用 级 协议 ， 相 对 于 OSI 参考 模型 来 说 ， 它 们 
处 于 较 高 的 层次 结构 , 所 以 也 称 为 高 层 协 议 。 应 用 层 的 协议 有 NFS、 Telnet、 SMTP、DNS、 SNMP 
和 FTP 等 ， 详 细 情 况 在 Internet 服务 中 介绍 。 


可 


5.5 ”Internet 基础 知识 


Internet 是 世界 上 规模 最 大 ， 覆 盖 面 最 广 旦 最 具 影 响 力 的 计算 机 互联 网 络 ， 它 是 将 分 布 在 
世界 各 地 的 计算 机 采用 开放 系统 协议 连接 在 一 起 ， 用 来 进行 数据 传输 、 信 息 交 换 和 资源 共享 。 
在 现 阶 段 ，Internet 作为 未 来 信息 高 速 公路 的 锥 形 , 无 论 在 科学 研究 、 教育 、 金融 , 还 是 在 商业 、 
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军事 等 部 门 ， 其 影响 都 越 来 越 大 。 
5.5.1 Internet 概述 


从 用 户 的 角度 来 看 ， 整 个 Internet 在 逻辑 上 是 统一 的 、 独 立 的 ， 在 物理 上 则 


不 同 的 网 络 


互 连 而 成 。 从 技术 角度 看 ，Internet 本 身 不 是 某 一 种 具体 的 物理 网 络 技术 ， 它 是 能 
息 的 众多 网 络 的 一 个 统称 ， 或 者 说 它 是 一 个 网 间 网 ， 只 要 人 们 进入 了 这 个 互联 网 


够 互相 传递 信 
， 就 是 在 使 用 


Internet。 正 是 由 于 Internet 的 这 种 特性 ， 使 得 广大 Internet 用 户 不 必 关 心 网 络 的 连接 ， 而 只 关心 


网 络 提供 的 丰富 资源 。 

连 入 Internet 的 计算 机 网 络 种 类 繁多 ， 形 式 各 异 ， 且 分 布 在 世界 各 地 ， 因 此 
器 (IP 网 关 ) 并 借助 各 种 通信 线路 或 公共 通信 网 络 把 它们 连接 起 来 。 由 于 实现 
网 的 互 连 ， 个 人 用 户 入 网 十 分 方便 ， 只 要 有 电话 和 Modem 即 可 ， 这 也 是 Internet 


协议 ， 由 于 该 协议 非常 有 效 且 使 用 方便 ， 许 多 操作 系统 都 支持 它 ， 无 论 是 服务 器 
机 都 可 安装 使 用 。 
对 于 全 球 性 最 大 的 互联 网 络 ， 总 的 来 说 无 确定 的 负责 人 ， 它 是 由 各 自 独立 管 
构成 的 ， 而 这 些 网 络 都 各 自 拥 有 自己 的 管理 体系 和 政策 法 规 。 因 此 ， 没 有 集中 的 
Internet 的 机 构 。 尽 管 如 此 ， 某 些 政府 部 门 在 制定 Internet 有 关 政 策 时 实际 上 起 
Internet 目前 的 最 高 国际 组 织 是 Internet 学 会 〈Internet Society)， 该 学 会 是 一 个 志 


了 与 公用 电话 
迅速 普及 的 原 


因 之 一 。Internet 由 美国 的 ARPANET 网 络 发 展 而 来 , 因此 , 它 沿 用 了 ARPANET 使 用 的 TCP/IP 


还 是 个 人 计算 


理 的 网 络 互联 
负责 掌管 整个 
着 主导 作用 。 

愿 者 组 织 ， 也 


是 一 个 非 盈 利 性 的 专业 化 组 织 ， 其 主要 目标 是 促进 Internet 的 改革 与 发 展 。 该 学 会 下 分 Internet 


体系 结构 研究 会 (IAB) 和 其 他 几 个 研究 会 , IAB 下 又 有 工程 组 (IETF)、 许可 证 管 


技术 研究 组 〈(IRTF ) 和 编号 管理 局 (IANA) 等 。IAB 的 主要 任务 是 为 支持 Internet 的 科研 与 开 


发 提供 服务 。 


理 局 (ICRS)、 


在 Internet 中 ， 分 布 着 一 些 履 盖 范围 很 广 的 大 网 络 ， 这 种 网 络 称 为 “Internet 主干 网 ”， 它 


们 一 般 属 于 国家 级 的 广域网 。 例 如 ， 我 国 的 CHINANET 和 CERNET 等 就 是 中 


的 Internet 主 


干 网 。 主 干 网 一 般 只 延伸 到 一 些 大 城市 或 重要 地 方 ， 在 那里 设立 主干 网 节点 。 每 


一 个 主干 网 节 


点 可 以 通过 路 由 器 将 广域网 与 局 域 网 联接 起 来 ， 一 个 节点 还 可 以 通过 另外 的 路 


器 与 其 他 局 域 


网 再 互 连 ， 由 此 形成 一 种 网 状 结构 。 
5.5.2 Internet 地 址 


无 论 是 在 网 上 检索 信息 还 是 发 送 电子 邮件 ， 都 必须 知道 对 方 的 Internet 地 址 
定 Intemet 上 每 一 人 台 计 算 机 、 每 个 用 户 的 位 置 。 也 就 是 说 ，Internet 上 每 一 台 计 算 
都 有 唯一 的 地 址 来 标识 它 是 谁 和 在 何 处 ， 以 方便 于 几 千 万 个 用 户 、 几 百 万 台 计 算 
的 组 织 。Internet 地 址 格式 主要 有 两 种 书写 形式 : 域名 格式 和 IP 地 址 格式 。 


， 它 能 唯一 确 
机 、 每 个 用 户 
机 和 成 十 上 万 
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1. 域名 


域名 (Domain Name) 通常 是 用 户 所 在 的 主机 名 字 或 地 址 。 域 名 格式 是 由 若干 部 分 组 成 ， 
每 个 部 分 又 称 子 域名 ， 它 们 之 间 用 “.” 分 开 ， 每 个 部 分 最 少 由 两 个 字母 或 数字 组 成 。 域 名 通常 
按 分 层 结构 来 构造 ， 每 个 子 域名 都 有 其 特定 的 含义 。 通 常情 况 ， 一 个 完整 、 通 用 的 层次 型 主机 
域名 由 如 下 4 部 分 组 成 : 
计算 机 主机 名 . 本 地 名 . 组 名 . 最 高 层 域名 

从 右 到 左 ， 子 域名 分 别 表示 不 同 的 国家 或 地 区 的 名 称 〈 只 有 美国 可 以 省 略 表示 国家 的 顶级 
域名 )、 组 织 类 型 、 组 织 名 称 、 分 组 织 名 称 和 计算 机 名 称 等 。 域 名 地 址 的 最 后 一 部 分 子 域名 称 
为 高 层 域名 (或 顶级 域名 )， 它 大 致 上 可 以 分 成 两 类 : 一 类 是 组 织 性 顶级 域名 ， 另 一 类 是 地 理 
性 顶级 域名 。 

例如 : www.dzkjdx.edu.cn cn 是 地 理性 顶级 域名 ， 表 示 “ 中 国 ”。 

www.263.net net 是 组 织 性 顶级 域名 ， 表 示 “ 网 络 技术 组 织 机 构 ”。 

如 果 一 个 主机 所 在 的 网 络 级 别 较 高 ， 它 可 能 拥有 的 域名 仅 三 部 分 : 本 地 名 . 组 名 .最 高 层 
域名 。 现 在 ，Internet 地 址 管理 机 构 (Internet PCA Registration Authority，IPRA) 和 (Internet 
Assigned Number Authority，IANA) 负责 Internet 最 高 层 域名 的 登记 和 管理 。 


2. IP 地 址 


Internet 地 址 是 按 名 字 来 描述 的 ， 这 种 地 址 表示 方式 易于 理解 和 记忆 。 实 际 上 ，Internet 中 
的 主机 地 址 是 用 他 地 址 来 唯一 标识 的 。 这 是 因为 Internet 中 所 使 用 的 网 络 协议 是 TCP/IP 协议 ， 
故 每 个 主机 必须 用 IP 地 址 来 标识 。 

每 个 IP 地 址 都 由 4 个 小 于 256 的 数字 组 成 ， 数 字 之 间 用 “.” 分 开 。Internet 的 IP 地 址 共 
有 32 位 ，4 个 字 节 。 它 表示 时 有 两 种 格式 : 二 进 制 格式 和 十 进 制 格式 。 二 进 制 格式 是 计算 机 所 
认识 的 格式 ， 十 进 制 格式 是 由 二 进 制 格式 “翻译 ”过 去 的 ， 主 要 是 为 了 便于 使 用 和 掌握 。 例 如， 十 
进 制 耳 地 址 129.102.4.11 的 表示 方法 与 二 进 制 的 表示 方法 10000001 01100110 00000100 00001011 
相同 ， 显 然 表 示 成 带 点 的 十 进 制 格式 则 方便 得 多 。 

域名 和 IP 地 址 是 一 一 对 应 的 ， 域 名 易于 记忆 ， 便 于 使 用 ， 因 此 得 到 比较 普遍 的 使 用 。 当 
户 和 Intemet 上 的 某 台 计算 机 交换 信息 时 , 只 需要 使 用 域名 , 网 络 则 会 自动 地 将 其 转换 成 他 地 址 ， 
找到 该 台 计算 机 。 

Internet 中 的 地 址 可 分 为 5 类 : A 类 、B 类 、C 类 、D 类 和 了 类 。 各 类 的 地 址 分 配方 案 如 图 
5-10 所 示 。 在 全 地 址 中 ， 全 0 代表 的 是 网 络 ， 全 1 代表 的 是 广播 。 

A 类 网 络 地 址 占有 1 个 字 节 (8 位 )， 定义 最 高 位 为 0 来 标识 此 类 地 址 , 余下 7 位 为 真正 的 
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网 络 地 址 ， 支 持 1 一 126 个 网 


3 版 ) 


络 。 后 下 


寻 址 。A 类 网 络 地 址 第 一 个 字 节 的 十 进 制 值 为 000 一 127。 


01 78 16 24 31 


A 类 : 


0 | 网 络 地 址 主机 地 址 (24) 


012 15 16 24 31 


B 类 : 


10 | 网 络 地 址 (14) | 十 机 地 址 (16) 


0123 24 31 


C 类 : 


110 | 。 网 络 地 址 (21) 主机 地 址 


01234 24 31 


D 类 : 


0 | 组 播 、 路 由 器 修改 (28) 


01234 24 


E 类 : 


1111 | 试验 用 地 址 (28) 


图 5-10 各 类 地 址 分 配方 案 


的 3 个 字 节 (24 位 ) 为 主机 地 址 ， 共 提供 2”-2 个 端点 的 


B 类 网 络 地 址 占有 2 个 字 节 ， 使 用 最 高 两 位 为 10 来 标识 此 类 地 址 ， 其 余 14 位 为 真正 的 网 
络 地 址 ， 主 机 地 址 占 后 面 的 2 个 字 节 (16 位 )， 所 以 B 类 全 部 的 地 址 有 (22) X (2'2) = 


16382X65 534 个 。B 类 
C 类 网 络 地 址 占有 3 


网 络 地 址 第 一 个 字 节 的 十 进 制 值 为 128 一 191。 
个 字 节 ， 它 是 最 通用 的 Internet 地 址 。 使 用 最 高 三 位 为 110 来 标识 此 


类 地 址 ， 其 余 21 位 为 真正 的 网 络 地 址 ， 因 此 C 类 地 址 支持 22-2 个 网 络 。 主 机 地 址 占 最 后 1 个 
字 节 ， 每 个 网 络 可 多 达 2*2 个 主机 。C 类 网 络 地 址 第 一 个 字 节 的 十 进 制 值 为 192 一 223。 


D 类 地 志 


址 第 一 个 字 节 的 十 进 制 值 为 224 一 239。 
E 类 地 址 为 实验 保留 , 其 识别 头 是 1111。E 类 网 络 地 址 第 一 个 字 节 的 十 进 制 值 为 240 一 255。 


网 络 软件 和 路 由 器 使 用 子 网 掩 码 (Subnet Mask) 来 识别 报 文 是 仅 存放 在 
由 转发 到 其 他 地 方 。 在 一 个 字段 内 ，1 的 出 现 表 明 一 个 字段 包含 所 有 或 部 分 
主机 地 址 位 置 。 例如, 最 常用 的 C 类 地 址 使 用 前 三 个 8 位 来 识别 网 络 , 最 后 一 个 8 位 识别 主机 。 
因此 ， 子 网 掩 码 是 255.255.255.0。 


上 是 相当 新 的 。 它 的 识别 头 是 1110， 用 于 组 播 ， 例 如 用 于 路 由 器 修改 。D 类 网 络 地 


网 络 内 部 还 是 被 路 
网 络 地 址 ，0 表明 


子 网 地 址 掩 码 是 相对 特别 的 IP 地 址 而 言 的 ， 如 果 脱 离 了 卫 地 址 就 毫 无 意义 。 它 的 出 现 一 
般 是 跟着 一 个 特定 的 他 地址, 用 来 为 计算 这 个 人 P 地 址 中 的 网 络 号 部 分 和 主机 号 部 分 提供 依据 。 


换 句 话说 ,就 是 在 写 一 个 人’ 地 址 后 ， 再 指明 哪些 是 网 络 号 部 分 ， 哪 些 是 3 
的 格式 与 耳 地 址 相同 ， 所 有 对 应 网 络 号 的 部 分 用 1 填 上 ， 所 有 对 应 主机 号 的 部 分 


A 类 、B 类 、C 类 了 人 P 地 址 类 默认 的 子 网 掩 码 如 表 5-2 所 示 。 


E 机 号 部 分 。 子 网 掩 码 


目 0 填 上 。 
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表 5-2 带 点 十 进 制 符号 表示 的 默认 子 网 掩 码 


地 址 类 子 网 撞 码 
A 类 11111111 00000000 00000000 00000000 255.0.0.0 
B 类 | 11111111 11111111 00000000 00000000 | 255.255.0.0 
C 类 11111111 11111111 11111111 00000000 255.255.255.0 


如 果 需 要 将 网 络 进行 子 网 划分 ， 此 时 子 网 掩 码 可 能 不 同 于 以 上 默认 的 子 网 掩 码 。 例 如 ， 
138.96.58.0 是 一 个 8 位 子 网 化 的 B 类 网 络 ID.。 基于 B 类 的 主机 ID 的 8 位 被 用 来 表示 子 网 化 的 
网 络 ， 对 于 网 络 138.96.39.0， 其 子 网 掩 码 应 为 255.255.255.0。 

例如 ， 一 个 B 类 地 址 172.16.3.4， 为 了 直观 地 告诉 大 家 前 16 位 是 网 络 号 ， 后 16 位 是 主机 
号 ， 就 可 以 附 上 子 网 掩 码 255.255.0.0(11111111 11111111 00000000 00000000)。 

假定 某 单 位 申请 的 B 类 地 址 为 179.143.XXX.XXX。 如 果 希 望 把 它 划分 为 14〈 至 少 占 二 进 
制 的 4 位) 个 虚拟 的 网 络 , 则 需要 占 4 位 主机 位 , 子 网 使 用 掩 码 为 255.255.240.0~255.255.255.0 
来 建立 子 网 。 每 个 LAN 可 有 22-2 个 主机 ， 且 各 子 网 可 具有 相同 的 主机 地 址 。 

假设 一 个 组 织 有 几 个 相对 大 的 子 网 ,每 个 子 网 包括 了 25 台 左 右 的 计算 机 ; 而 又 有 一 些 相对 较 
小 的 子 网 , 每 个 子 网 大 概 只 有 几 台 计算 机 。 这 种 情况 下 , 可 以 将 一 个 C 类 地 址 分 成 6 个 子 网 (每 
个 子 网 可 以 包含 30 台 计 算 机 )， 这 样 解决 了 很 大 的 问题 。 但 是 出 现 了 一 个 新 的 情况 ， 那 就 是 大 
的 子 网 基本 上 完全 利用 了 IP 地 址 范围 ， 但 是 小 的 子 网 却 造成 了 许多 IP 地 址 的 浪费 。 为 了 解决 
这 个 新 的 难题 ， 避 免 任何 的 人 P 浪费 ， 就 出 现 了 人 允许 应 用 不 同 大 小 的 子 网 掩 码 来 对 IP 地 址 空间 
进行 子 网 划分 的 解决 方案 。 这 种 新 的 方案 就 叫 作 可 变 长 子 网 掩 码 (VLSM)。 

VLSM 用 一 个 十 分 直观 的 方法 来 表示 ， 那 就 是 在 IP 地 址 后 面 加 上 “/ 网 络 号 及 子 网 络 号 编 
址 位 数 ”。 例 如 ，193.168.125.0/27 就 表示 前 27 位 表示 网 络 号 。 

例如 ， 给 定 135.41.0.0/16 的 基于 类 的 网 络 ID， 所 需 的 配置 是 为 将 来 使 用 保留 一 半 的 地 址 ， 
其 余 的 生成 15 个 子 网 ， 达 到 2000 台 主 机 。 

由 于 要 为 将 来 使 用 保留 一 半 的 地 址 ， 完 成 了 135.41.0.0 的 基于 类 的 网 络 ID 的 1- 位 子 网 化 ， 
生成 两 个 子 网 135.41.0.0/17 和 135.41.128.0/17， 子 网 135.41.128.0/17 被 选 作为 将 来 使 用 所 保留 
的 地 址 部 分 ，135.41.0.0/17 被 继续 生成 子 网 。 

为 达到 划分 2000 台 主 机 的 15 个 子 网 的 要 求 ， 需 要 将 135.41.128.0/17 的 子 网 化 的 网 络 ID 
的 4- 位 子 网 化 。 这 就 产生 了 16 个 子 网 (135.41.128.0/21，135.41.136.0/21，…，135.41.240.0/21， 
135.41.248.0/21)， 人 允许 每 个 子 网 有 2046 台 主 机 。 最 初 的 15 个 子 网 化 的 网 络 ID (135.41.128.0/ 
21 一 135.41.240.0/21) 被 选 定 为 网 络 ID， 从 而 实现 了 要 求 。 

现在 的 他 协议 的 版 本 号 为 4， 所 以 也 称 之 为 IPv4, 为 了 方便 网 络 管理 员 阅 读 和 理解 ， 使 用 
了 4 个 十 进 制 数 中 间 加 小 数 点 “.” 来 表示 。 但 随 着 因特网 的 膨胀 ，IPv4 不 论 从 地 址 空间 上 ,还 
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是 协议 的 可 用 性 上 都 无 法 满足 因特网 的 新 要 求 。 这 样 出 现 一 个 新 的 人 P 协议 IPv6， 它 使 用 了 8 
个 十 六 进 制 数 中 间 加 小 数 点 “: ”来 表示 。IPv6 将 原来 的 32 位 地 址 扩展 成 为 128 位 地 址 ， 彻 底 
解决 了 地 址 缺乏 的 问题 。 


3. NAT 技术 


因特网 面临 他 地址 短缺 的 问题 。 解 决 这 个 问题 有 所 谓 长 期 的 或 短期 的 两 种 解决 方案 。 长 期 的 
解决 方案 就 是 使 用 具有 更 大 地 址 空间 的 IPv6 协议 ， 网 络 地 址 翻译 (Network Address Translators， 
NAT) 是 许多 短期 的 解决 方案 中 的 一 种 。 

NAT 技术 最 初 提出 的 建议 是 在 子 网 内 部 使 用 局 部 地 址 ， 而 在 子 网 外 部 使 用 少量 的 全 局 地 
址 ， 通 过 路 由 器 进行 内 部 和 外 部 地 址 的 转换 。NAT 的 实现 主要 有 两 种 形式 。 

第 一 种 应 用 是 动态 地 址 翻译 (Dynamic Address Translation)。 为 此 , 首先 引入 存根 域 的 概念 ， 
所 谓 存根 域 Stub Domain)， 就 是 内 部 网 络 的 抽象 ， 这 样 的 网 络 只 处 理 源 和 目标 都 在 子 网 内 部 
的 通信 。 任 何 时 候 存根 域内 只 有 一 部 分 主机 要 与 外 界 通 信 ， 甚 至 还 有 许多 主机 可 能 从 不 与 外 界 
通信 ， 所 以 整个 存根 域 只 需 共 享 少量 的 全 局 卫 地 址 。 存 根 域 有 一 个 边界 路 由 器 ,由 它 来 处 理 域 
内 与 外 部 的 通信 。 假 定 : 

。 m: 需要 翻译 的 内 部 地 址 数 。 

。 n: 可 用 的 全 局 地 址 数 (NAT 地 址 )。 

当 m:n 翻译 满足 条 件 (m>land m>n) 时 ， 可 以 把 一 个 大 的 地 址 空间 映像 到 一 个 小 的 地 址 
空间 。 所 有 NAT 地 址 放 在 一 个 缓冲 区 中 , 并 在 存根 域 的 边界 路 由 器 中 建立 一 个 局 部 地 址 和 全 局 
地 址 的 动态 映像 表 ， 如 图 5-11 所 示 。 这 个 图 显示 的 是 把 所 有 B 类 网 络 138.201 中 的 IP 地 址 翻 
译 成 C 类 网 络 178.201.112 中 的 也 地 址 。 这 种 NAT 地 址 重用 有 如 下 特点 。 


SRC 138.201.148.32 NAT 路 由 器 SRC 178.201.112.34 
动态 NAT 表 


SRC 138.201.148.151 
DST 138.201.148.151… 


SRC 178.201.112.11 
DST 178.201.112.11 


动态 NAT 表 
内 部 亿 | NATP 
138.201.148.32 | 178.201.112.34 | sRc. 源 地 址 


138.201.148.151 | 178.201.112.11 | DST: 目标 地 址 


图 5-11 动态 网 络 地 址 翻译 
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(1) 只 要 缓冲 区 中 存在 尚未 使 用 的 C 类 地 址 ， 任 何 从 内 向 外 的 连接 请 求 都 可 以 得 到 响应 ， 
并 且 在 边界 路 由 器 的 动态 NAT 表 中 为 之 建立 一 个 映像 表 项 。 

(2) 如 果 内 部 主机 的 映像 存在 ， 就 可 以 利用 它 建立 连接 。 

(3) 从 外 部 访问 内 部 主机 是 有 条 件 的 ， 即 动态 NAT 表 中 必须 存在 该 主机 的 映像 。 

动态 地 址 翻译 的 好 处 是 节约 了 全 局 适用 的 卫 地 址 ， 而 且 不 需要 改变 子 网 内 部 的 任何 配置 ， 
只 需 在 边界 路 由 器 中 设置 一 个 动态 地 址 变换 表 就 可 以 工作 了 。 

另外 一 种 特殊 的 NAT 应 用 是 m : 1 翻译 , 这 种 技术 也 叫 作伪 装 (Masquerading)， 因 为 用 一 
个 路 由 器 的 IP 地址 可 以 把 子 网 中 所 有 主机 的 IP 地 址 都 隐藏 起 来 。 如 果子 网 中 有 多 个 主机 要 同 
时 通信 ， 那 么 还 要 对 端口 号 进行 翻译 ， 所 以 这 种 技术 更 经 常 被 称 为 网 络 地 址 和 端口 翻译 
(Network Address Port Translation，NAPT)。 在 很 多 NAPT 实现 中 ， 专 门 保留 一 部 分 端口 号 给 伪 
装 使 用 ， 叫 作伪 装 端口 号 。 图 5-12 中 的 NAT 路 由 器 中 有 一 个 伪装 表 ， 通 过 这 个 表 对 端口 号 进 
行 翻译 ， 从 而 隐藏 了 内 部 网 络 138.201 中 的 所 有 主机 。 


SRC 138.201.148.32 :1275 NAT 店 而 器 1SRC 195.112.12.161:63451 


DST 193.46.94.115:80 胃 甘 NAT 表 DST 193.46.94.115:80 
| 


SRC195.112.12.161:63452 
DST 53.12.198.15: 23 


SRC 138.201.160.2014192| 
DST 53.12.198.15:23 … 


伪装 NAT 表 
内 部 IP/ 端 口号 本 地 NAT 端口 
. SRC: 源 地 址 
138.201.148.32:1275 63451 DST: 目标 地 址 
138.201.160.201:4192 63452 
图 5-12 地 址 伪装 


可 以 看 出 ， 这 种 方法 有 如 下 特点 。 
(1) 出 口 分 组 的 源 地 址 被 路 由 器 的 外 部 IP 地 址 所 代替 ,出口 分 组 的 源 端口 号 被 一 个 未 使 用 
的 伪装 端口 号 所 代替 。 

(2) 如 果 进 来 的 分 组 的 目标 地 址 是 本 地 路 由 器 的 他 地址 , 而 目标 端口 号 是 路 由 器 的 伪装 端 
号 ， 则 NAT 路 由 器 就 检查 该 分 组 是 否 为 当前 的 一 个 伪装 会 话 ， 并 试图 通过 它 的 伪装 表 对 卫 
地 址 和 端口 号 进行 翻译 。 

伪装 技术 可 以 作为 一 种 安全 手段 使 用 ， 借 以 限制 外 部 对 内 部 主机 的 访问 。 另 外 ， 还 可 以 用 
这 种 技术 实现 虚拟 主机 和 虚拟 路 由 ， 以 便 达 到 负载 均衡 和 提高 可 靠 性 的 目的 。 
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4. IPv6 简介 


IPv4〈IP version 4) 标准 是 20 世纪 70 年 代 末期 制定 完成 的 。20 世纪 90 年 代 初期 ，WWW 
的 应 用 导致 因特网 爆炸 性 发 展 ， 随 着 因特网 应 用 类 型 日 趋 复杂 ， 终 端 形式 特别 是 移动 终端 的 多 
样 化 ， 全 球 独立 IP 地 址 的 提供 已 经 开始 面临 沉重 的 压力 。IPv4 将 不 能 满足 因特网 长 期 发 展 的 
需要 ， 必 须 立 即 开始 下 一 代 了 P 网 络 协议 的 研究 。 由 此 ，IETF 于 1992 年 成 立 了 IPNG (IP Next 
Generation) 工作 组 ;1994 年 夏 ，IPNG 工作 组 提出 了 下 一 代 IP 网 络 协议 (IP version 6，IPv6) 
的 推荐 版 本 ; 1995 年 夏 ，IPNG 工作 组 完成 了 IPv6 的 协议 文本 ; 1995 年 一 1999 年 完成 了 IETF 
要 求 的 协议 审定 和 测试 ，1999 年 成 立 了 IPv6 论坛 ， 开 始 正式 分 配 IPv6 地 址 ，IPv6 的 协议 文本 
成 为 标准 草案 。 

IPv6 具有 长 达 128 位 的 地 址 空间 ， 可 以 彻底 解决 IPv4 地 址 不 足 的 问题 。 由 于 IPv4 地 址 是 
32 位 二 进 制 ， 所 能 表示 的 IP 地 址 个 数 为 22-4 294 967 296 守 40 亿 个 ， 因 而 在 因特网 上 约 有 40 
亿 个 全 地 址 。 由 32 位 的 IPv4 升级 至 128 位 的 IPv6， 因 特 网 中 的 人 P 地 址 从 理论 上 讲 会 有 222s= 
3.4X108 个， 如 果 整 个 地 球 表面 (包括 陆地 和 水 面 ) 都 覆盖 着 计算 机 ， 那 么 IPv6 允许 每 平方 米 
有 7X102 个 IP 地 址 ， 如 果 地 址 分 配 的 速率 是 每 秒 分 配 100 万 个 ， 则 需要 102 年 的 时 间 才 能 将 所 
有 地 址 分 配 完毕 ， 可 见 ， 在 想象 得 到 的 将 来 ，IPv6 的 地 址 空间 是 不 可 能 用 完 的 。 除 此 之 外 ，IPv6 
还 采用 分 级 地 址 模式 、 高 效 卫 包 首 部 、 服 务 质量 、 主 机 地 址 自动 配置 、 认 证 和 加 密 等 许多 技术 。 

1) IPv6 数据 包 的 格式 

IPv6 数据 包 有 一 个 40 字 节 的 基本 首部 (Base Header)， 其 后 可 允许 有 0 个 或 多 个 扩展 首部 
(Extension Header)， 再 后 面 是 数据 。 图 5-13 所 示 的 是 IPv6 基本 首部 的 格式 。 每 个 IPv6 数据 包 
都 是 从 基本 首部 开始 。IPv6 基本 首部 的 很 多 字段 可 以 和 IPv4 首部 中 的 字段 直接 对 应 。 


0 4 12 16 24 31 
版 本 号 | 通信 类 型 流标 号 

公 净 负 荷 长 度 下 一 个 首部 跳 数 限制 

屯 上 可 
提 [ 128 位 源 地 址 | 
本 

首 

部 上 二 
| 上 128 位 目的 地 址 J 

= 4 个 字 节 一 


图 5-13 IPv6 基本 首部 的 格式 
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。 版 本 号 : 该 字段 占 4 位 ， 说 明了 耳 协议 的 版 本 。 对 IPv6 而 言 ， 该 字段 值 是 0110， 也 
就 是 十 进 制 数 的 6。 

。 ”通信 类 型 : 该 字段 占 8 位 ， 其 中 优先 级 字段 占 4 位 , 使 源 站 能 够 指明 数据 包 的 流 类 型 。 
首先 ，IPv6 把 流 分 成 两 大 类 ， 即 可 进行 拥塞 控制 的 和 不 可 进行 拥塞 控制 的 。 每 一 类 又 
分 为 8 个 优先 级 。 优 先 级 的 值 越 大 ,表明 该 分 组 越 重要 。 对 于 可 进行 拥塞 控制 的 业务 ， 
其 优先 级 为 0 一 7。 当 发 生 拥 塞 时 ， 这 类 数据 包 的 传输 速率 可 以 放 慢 。 对 于 不 可 进行 拥 
塞 控制 的 业务 ， 其 优先 级 为 8 一 15。 这 些 都 是 实时 性 业务 ， 如 音频 或 视频 业务 的 传输 。 
这 种 业务 的 数据 包 发 送 速率 是 恒定 的 ， 即 使 丢掉 了 一 些 ， 也 不 进行 重 发 。 

。 流标 号 : 该 字段 占 20 位 。 所 谓 流 , 就 是 因特网 上 从 一 个 特定 源 站 到 一 个 特定 目的 站 ( 单 
播 或 多 播 ) 的 一 系列 数据 包 。 所 有 属于 同一 个 流 的 数据 包 都 具有 同样 的 流标 号 。 源 站 
在 建立 流 时 是 在 224-1 个 流标 号 中 随机 选择 一 个 流标 号 。 流 标号 0 保留 作为 指出 没有 
采用 流标 号 。 源 站 随机 地 选择 流标 号 并 不 会 在 计算 机 之 间 产 生 冲 突 ， 因 为 路 由 器 在 将 
一 个 特定 的 流 与 一 个 数据 包 相 关联 时 ， 使 用 的 是 数据 包 的 源 地 址 和 流标 号 的 组 合 。 

从 一 个 源 站 发 出 的 具有 相同 非 0 流标 号 的 所 有 数据 包 ， 都 必须 具有 相同 的 源 地 址 
和 目的 地 址 ， 以 及 相同 的 逐 跳 选 项 首部 〈 若 此 首部 存在 ) 和 路 由 选择 首部 〈 若 此 首 前 
存在 ) 。 这 样 做 的 好 处 是 当 路 由 器 处 理 数据 包 时 ， 只 要 查 一 下 流标 号 即 可 ， 而 不 必 查 
看 数据 包 首部 中 的 其 他 内 容 。 任 何 一 个 流标 号 都 不 具有 特定 的 意义 ， 源 站 应 将 它 希 望 
各 路 由 器 对 其 数据 包 进行 的 特殊 处 理 写 明 在 数据 包 的 扩展 首部 中 。 

。 净 负 荷 长 度 (Payload Length): 该 字段 占 16 位 ， 指 明 除 首部 自身 的 长 度 外 ，IPv6 数据 
包 所 载 的 字 节 数 。 可 见 ， 一 个 IPv6 数据 包 可 容纳 64KB 长 的 数据 。 由 于 IPv6 的 首部 
长 度 是 固定 的 ， 因 此 没有 必要 像 IPv4 那样 指明 数据 包 的 总 长 度 〈 首 部 与 数据 部 分 
之 和 )。 

。 下 一 个 首部 (Next Header): 该 字段 占 8 位 ,标识 紧 接 着 IPv6 首部 的 扩展 首部 的 类 型 。 
这 个 字段 指明 在 基本 首部 后 面 紧 接着 的 一 个 首部 的 类 型 。 

。” 跳 数 限制 (Hop Limit): 该 字段 占 8 位 ， 用 来 防止 数据 包 在 网 络 中 无 限期 地 存在 。 源 
站 在 每 个 数据 包 发 出 时 即 设 定 某 个 跳 数 限 制 。 每 一 个 路 由 器 在 转发 数据 包 时 ， 要 先 将 
跳 数 限制 字段 中 的 值 减 1。 当 跳 数 限制 的 值 为 0 时 ， 就 要 将 此 数据 包 丢 弃 。 这 相当 于 
IPv4 首部 中 的 生存 期 字段 ， 但 比 IPv4 中 的 计算 时 间 间 隔 要 简单 些 。 

。 源 站 耳 地 址 : 该 字段 占 128 位 ， 是 数据 包 的 发 送 站 的 人 P 地 址 。 

。 目的 站 卫 地 址 : 该 字段 占 128 位 ， 是 数据 包 的 接收 站 的 卫 地 址 。 

2) IPv6 的 地 址 表示 

一 般 来 讲 ， 一 个 IPv6 数据 包 的 目的 地 址 可 以 是 以 下 三 种 基本 类 型 地 址 之 一 。 
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e。 单 播 (Unicast): 传统 的 点 对 点 通信 。 
。 多 播 (Multicast): 一 点 对 多 点 的 通信 ， 数 据 包 交付 到 一 组 计算 机 中 的 每 一 个 。IPv6 
没有 采用 广播 的 术语 ， 而 是 将 广播 看 作 多 播 的 一 个 特例 。 
。 任 播 (Anycast): 这 是 IPv6 增加 的 一 种 类 型 。 任 播 的 目的 站 是 一 组 计算 机 ， 但 数据 包 
在 交付 时 只 交付 给 其 中 的 一 个 ， 通 常 是 距离 最 近 的 一 个 。 
为 了 使 地 址 的 表示 简洁 些 , IPv6 使 用 冒号 十 六 进 制 记 法 (Colon Hexadecimal Notation, Colon 
Hex) ， 它 把 每 个 16 位 用 相应 的 十 六 进 制 表示 ， 各 组 之 间 用 冒号 分 隔 。 


侦 


冒号 十 六 进 制 记 法 允许 0 压缩 (Zero Compression》 也 就 是 说 ， 一 连 串 连续 的 0 可 以 用 一 
对 冒号 所 取代 。 例 如 : 


例如 : FF05: 0: 0: 0: 0: 0: 0: B3 可 以 改 成 FF05:: B3。 


为 了 保证 0 压缩 有 一 个 清晰 的 解释 ， 建 议 中 规定 ， 在 任 一 地 址 中 ， 只 能 使 用 一 次 0 压缩 。 
该 技术 对 已 建议 的 分 配 策略 特别 有 用 ， 因 为 会 有 许多 地 址 包含 连续 的 0 串 。 

另外 ， 冒 号 十 六 进 制 记 法 可 结合 有 点 分 十 进 制 记 法 的 后 缀 。 这 种 结合 在 IPv4 向 IPv6 的 转 
换 阶 段 特 别 有 用 。 例 如 ， 下 面 的 串 是 一 个 合法 的 冒号 十 六 进 制 记 法 : 


0: 0: 0: 0: 0: 0: 128.10.1.1 


请 注意 ， 在 这 种 记 法 中 ， 虽 然 为 冒号 所 分 隔 的 每 个 值 是 一 个 16 位 的 量 ， 但 每 个 点 分 十 进 
制 部 分 的 值 则 指明 一 个 字 节 的 值 。 再 使 用 0 压缩 即 可 得 出 : 


: 128.10.1.1 
5.5.3 Internet 服务 


为 全 世界 最 大 的 国际 性 计算 机 网 络 的 Internet， 为 全 球 的 科研 界 、 教 育 界 和 娱乐 界 等 方 
方面 面 提供 了 极其 丰富 的 信息 资源 和 最 先进 的 信息 交流 手段 。 在 Internet 上 ， 时 刻 传 送 着 大 量 
的 各 种 各 样 的 信息 ， 从 电影 、 实 况 转播 到 最 尖端 的 科学 研究 等 无 所 不 包 ， 当 然 信 息 最 多 的 还 是 
科技 信息 ， 如 计算 机 软件 、 科 技 论文 、 图 书馆 /出 版 社 目 录 、 最 新 科技 动态 、 电 子 杂 志 、 产 品 推 
销 和 网 络 新 闻 等 。 而 这 些 内 容 均 可 由 Internet 服务 来 为 用 户 提供 。 

使 用 传输 控制 协议 或 用 户 数据 报 协议 时 ，Intemet IP 可 支持 65 535 种 服务 ， 这 些 服 务 是 通 
过 各 个 端口 到 名 字 实 现 的 逻辑 连接 。 端口 分 两 类 : 一 类 是 已 知 端口 或 称 公 共 端 口 , 端口 号 为 0 一 
1023， 这 些 端 口 由 Internet 赋值 地 址 和 端口 号 的 组 织 赋值 ， 另 一 类 是 需 在 IANA 注册 登记 端口 


如 : 686E: 8C64: FFFF: FFFF: 0: 1180: 96A: FFFF 
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号 ,为 1024 一 65 535。 
前 面 介绍 Internet 网 络 接口 层 、 网 际 层 协议 和 传输 层 协 议 ， 本 节 主 要 介绍 Internet 的 高 层 协 
议 ， 如 域名 服务 、 远 程 登录 服务 、 电 子 邮 件 服务 、WWW 服务 和 文件 传输 服务 等 。 


1. 域名 服务 


Internet 中 的 域名 地 址 与 IP 地 址 是 等 价 的 ， 它 们 之 间 是 通过 域名 服务 来 完成 映射 变换 的 。 
实际 上 ，DNS 是 一 种 分 布 式 地 址 信息 数据 库 系统 ， 服 务 器 中 包含 整个 数据 库 的 某 部 分 信息 ， 并 
供 客户 查询 。DNS 允许 局 部 控制 整个 数据 库 的 某 些 部 分 , 但 数据 库 的 每 一 部 分 都 可 通过 全 网 查 
询 得 到 。 

域名 系统 采用 的 是 客户 端 /服务 器 模式 , 整个 系统 由 解析 器 和 域名 服务 器 组 成 。 解析 器 是 客 
户 方 ， 它 负责 查询 域名 服务 器 、 解 释 从 服务 器 返回 来 的 应 答 、 将 信息 返回 给 请 求 方 等 工作 。 域 
名 服务 器 是 服务 器 方 ， 它 通常 保存 着 一 部 分 域名 空间 的 全 部 信息 ， 这 部 分 域名 空间 称 为 区 
(Zone)。 一 个 域名 服务 器 可 以 管理 一 个 或 多 个 区 。 域名 服务 器 可 以 分 为 主 服 务 器 、Caching Only 
服务 器 和 转发 服务 器 (Forwarding Server)。 

域名 系统 是 一 个 分 布 式 系统 ,其 管理 和 控制 也 是 分 布 式 的 。 一 个 用 户 A 在 查找 另 一 用 户 B 
时 ， 域 名 系统 的 工作 过 程 如 下 。 

(1) 解析 器 向 本 地 域名 服务 器 发 出 请 求 查 阅 用 户 B 的 域名 。 

(2) 本 地 域名 服务 器 向 最 高 层 域名 服务 器 发 出 查询 地 址 的 请 求 。 

(3) 最 高 层 域名 服务 器 返回 给 本 地 域名 服务 器 一 个 IP 地 址 。 

(4) 本 地 域名 服务 器 向 组 域名 服务 器 发 出 查询 地 址 的 请 求 。 

(5) 组 域名 服务 器 返回 给 本 地 域名 服务 器 一 个 IP 地 址 。 

(6) 本 地 服务 器 向 刚 返回 的 域名 服务 器 发 出 查询 域名 地 址 请 求 。 

(7) 人 P 地 址 返回 给 本 地 域名 服务 器 。 

(8) 本 地 域名 服务 器 将 该 地 址 返回 给 解析 器 。 

此 ， 本 地 域名 服务 器 为 了 得 到 一 个 卫 地 址 常常 需要 查询 多 个 域名 服务 器 。 于 是 ， 在 查 
询 地 址 的 同时 ， 本 地 域名 服务 器 也 就 得 到 了 许多 其 他 域名 服务 器 的 信息 ， 像 它们 的 人 P 地 址 、 所 
负责 的 区 域 等 。 本 地 域名 服务 器 将 这 些 信 息 连 同 最 终 查 询 到 的 主机 人 P 地 址 全 部 存放 在 它 的 
Cache 中 ， 以 便 将 来 参考 。 当 下 次 解析 器 再 查询 与 这 些 域名 相关 的 信息 时 ， 就 可 以 直接 引用 。 
这 样 就 大 大 减少 了 查询 时 间 。 

因此 , 访问 主机 的 时 候 只 需要 知道 域名 ， 通过 DNS 服务 器 将 域名 变换 为 卫 地 址 。DNS 所 
用 的 是 UDP 端口 ， 端 口号 为 53。 
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2， 远程 登录 服务 


远程 登录 服务 是 在 Telnet 协议 的 支持 下 ， 将 用 户 计算 机 与 远程 主机 连接 起 来 ， 在 远程 计算 
机 上 运行 程序 ， 将 相应 的 屏幕 显示 传送 到 本 地 机 器 ， 并 将 本 地 的 输入 送 给 远程 计算 机 。 由 于 这 
种 服务 基于 Telnet 协议 且 使 用 Telnet 命令 进行 远程 登录 ， 故 称 为 Telnet 远程 登录 。 

Telnet 是 基于 客户 端 /服务 器 模式 的 服务 系统 ， 它 由 客户 端 软件 、 服 务 器 软件 以 及 Telnet 通 
信 协 议 三 部 分 组 成 。 远 程 计算 机 又 称 为 Telnet 主机 或 服务 器 ， 本 地 计算 机 作为 Telnet 客户 端 来 
使 用 ， 它 起 到 远程 主机 的 一 台 虚 拟 终端 (仿真 终端 的 作用 ， 通 过 它 用 户 可 以 与 主机 上 的 其 他 
用 户 一 样 共同 使 用 该 主机 提供 的 服务 和 资源 。 

当 用 户 使 用 Telnet 登录 远程 主机 时 ,该 用 户 必须 在 这 个 远程 主机 上 拥有 合法 的 账号 和 相应 
的 密码 ， 否 则 远程 主机 将 会 拒绝 登录 。 在 运行 Telnet 客户 程序 后 ， 首 先 应 该 建立 与 远程 主机 的 
TCP 连接 ， 从 技术 上 讲 ， 就 是 在 一 个 特定 的 TCP 端口 (端口 号 一 般 为 23) 上 打开 一 个 套 接 字 ， 
如 果 远 程 主机 上 的 服务 器 软件 一 直 在 这 个 周知 的 端口 上 侦 听 连接 请 求 ， 则 这 个 连接 便 会 建立 起 


来 ， 此 时 


户 的 计算 机 就 成 为 该 远程 主机 的 一 个 终端 ， 便 可 以 进行 联机 操作 了 ， 即 以 终端 方式 


为 用 户 提供 人 机 界面 。 然 后 将 用 户 输入 的 信息 通过 Telnet 协议 便 可 以 传送 给 远程 主机 ， 主 机 在 
周知 的 TCP 端口 上 侦 听 到 用 户 的 请 求 并 处 理 后 ,将 处 理 的 结果 通过 Telnet 协 议 返回 给 客户 程序 。 
最 后 客户 端 接收 到 远程 主机 发 送 来 的 信息 ， 并 经 过 适当 的 转换 显示 在 用 户 计算 机 的 屏幕 上 。 


3， 电子 邮件 服务 


电子 邮件 (E-mail》 就 是 利用 计算 机 进行 信息 交换 的 电子 媒体 信件 。 它 是 随 着 计算 机 网 络 
而 出 现 的 ， 并 依靠 网 络 的 通信 手段 实现 普通 邮件 信息 的 传输 。 它 是 最 广泛 的 一 种 服务 。 

电子 邮件 是 一 种 通过 计算 机 网 络 与 其 他 用 户 进行 联系 的 快速 、 简 便 、 高 效 、 价 廉 的 现代 化 
通信 手段 。 要 想 使 用 E-mail， 首 先 必须 拥有 一 个 电子 邮箱 ， 它 是 由 E-mail 服务 提供 者 为 其 用 户 


建立 在 E-mail 服务 器 磁盘 上 的 专用 于 存放 电子 邮件 的 存储 区 域 ， 并 由 E-mail 服务 器 进行 管理 。 
用 户 将 使 用 E-mail 客户 软件 在 自己 的 电子 邮箱 里 收发 电子 邮件 。 电 子 邮件 地 址 的 一 般 格式 : 用 


户 名 @ 了 


E 机 名 ， 例 妇 


fazhang@china.com。 


E-mail 系统 基于 客户 端 /服务 器 模式 ， 整 个 系统 由 E-mail 客户 端 软件 、E-mail 服务 器 和 通 
信 协 议 三 部 分 组 成 。E-mail 客户 端 软件 也 称 用 户 代理 User Agent)， 是 用 户 用 来 收发 和 管理 电 
子 邮件 的 工具 ，E-mail 服务 器 主要 充当 “邮局 ”的 角色 ， 它 除了 为 用 户 提供 电子 邮箱 外 ， 还 承 
担 着 信件 的 投递 业务 ， 当 用 户 发 送 一 个 电子 邮件 后 , E-mail 服务 器 通过 网 络 若干 中 间 节 点 的 “ 存 
储 - 转 发 ” 式 的 传递 ， 最 终 把 信件 投递 到 目的 地 《 收 信人 的 电子 邮箱 )，E-mail 服务 器 主要 采用 
SMTP (简单 邮件 传输 协议 )， 本 协议 描述 了 电子 邮件 的 信息 格式 及 其 传递 处 理 方法 ， 保 证 被 人 
送 的 电子 邮件 能 够 ] 


E 确 地 寻 址 和 可 靠 地 传输 ， 它 是 面向 文本 的 网 络 协 议 ， 其 缺点 是 不 能 用 来 传 
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送 非 ASCII 码 文本 和 非 文字 性 附件 , 在 日 益 发 展 的 多 媒体 环境 中 以 及 人 们 关注 的 邮件 私密 性 方 
面 , 更 显 出 它 的 局 限 性 。 后 来 的 一 些 协议 ， 包 括 多 用 途 Internet 邮件 扩充 协议 (MIME) 及 增强 
私密 邮件 保护 协议 PEM)， 弥 补 了 SMTP 的 缺点 。 而 SMTP 是 用 在 大 型 多 用 户 、 多 任务 的 操 
作 系 统 环境 中 ,将 它 用 在 PC 上 收 信和 是 十 分 困难 的 ， 所 以 在 TCP/IP 网 络 上 的 大 多 数 邮件 管理 程 
序 使 用 SMTP 来 发 信 ， 且 采用 POP (Post Office Protocol)( 常 用 的 是 POP3) 来 保管 用 户 未 能 及 
时 取 走 的 邮件 。 

POP 协议 有 两 个 版 本 : POP2 和 POP3。 目 前 使 用 的 POP3 既 能 与 STMP 共同 使 用 ， 也 可 以 
单独 使 用 , 以 传送 和 接收 电子 邮件 .POP 协议 是 一 种 简单 的 纯 文本 协议 , 每 次 传输 以 整个 E-mail 
为 单位 ， 不 能 提供 部 分 传输 。 

用 户 要 传送 E-mail， 首 先 需 在 联网 的 计算 机 上 使 用 邮件 软件 编 好 邮件 正文 ， 填 好 邮件 收 信 
人 的 E-mail 地 址 、 发 信人 电子 邮件 地 址 (或 自动 填 上 )、 邮 件 的 主题 等 内 容 ， 然 后 使 用 E-mail 
的 发 送 命令 发 出 。 此 时 ，E-mail 发 送 端 与 接收 端的 计算 机 在 工作 时 并 不 直接 进行 通信 ， 而 是 在 
发 信 端 计算 机 送出 邮件 后 ， 先 到 达 自 己 所 注册 的 邮件 服务 器 主机 ， 再 在 网 络 传输 过 程 中 经 过 多 
个 计算 机 和 路 由 器 的 中 转 ， 到 达 目 的 地 的 邮件 服务 器 主机 ， 送 进 收 信人 的 电子 邮箱 ， 最 后 当 邮 
件 的 接收 者 上 网 并 启动 电子 邮件 管理 程序 ， 它 就 会 自动 检查 邮件 服务 器 中 的 电子 邮箱 ， 若 发 现 
新 邮件 ， 便 会 下 载 到 自己 的 计算 机 上 ， 完 成 接收 邮件 的 任务 。 

简单 邮件 传送 协议 和 用 于 接收 邮件 的 POP3 均 是 利用 TCP 端口 .SMTP 所 用 的 端口 号 是 25， 
POP3 所 用 的 端口 号 是 110。 


4. WWW (World Wide Web， 万 维 网 ) 服务 


万 维 网 是 一 种 交互 式 图形 界 面 的 Internet 服务 ， 具 有 强大 的 信息 连接 功能 ， 是 目前 Internet 
中 最 受 欢迎 的 、 增 长 速度 最 快 的 一 种 多 媒体 信息 服务 系统 。 

万 维 网 是 基于 客户 端 /服务 器 模式 的 信息 发 送 技术 和 超 文 本 技术 的 综合 ，WWW 服务 器 把 
信息 组 织 为 分 布 的 超 文 本 ， 这 些 信息 节点 可 以 是 文本 、 子 目录 或 信息 指针 。WWW 浏览 程序 为 
用 户 提 供 基 于 超 文本 传输 协议 (Hyper Text Transfer Protocol，HTTP) 的 用 户 界面 ，WWW 服务 
器 的 数据 文件 由 超 文本 标记 语言 (Hyper Text Markup Language，HTML) 描述 ，HTML 利用 统 
一 资源 定位 器 (URL) 的 指标 是 超 媒 体 链接 ， 并 在 文本 内 指向 其 他 网 络 资源 。 

超 文本 传输 协议 是 一 个 Internet 上 的 应 用 层 协 议 ， 是 Web 服务 器 和 Web 浏览 器 之 间 进 行 
通信 的 语言 。 所 有 的 Web 服务 器 和 Web 浏览 器 必须 遵循 这 一 协议 ， 才 能 发 送 或 接收 超 文本 文 
件 。HTTP 是 客户 端 /服务 器 体系 结构 ， 提 供 信息 资源 的 Web 节点 〈 即 Web 服务 器 )， 可 称 作 
HTTP 服务 器 ，Web 浏览 器 则 是 HTTP 服务 器 的 客户 。WWW 上 的 信息 检索 服务 系统 就 是 遵循 
HTTP 运行 的 。 在 HTTP 的 帮助 下 ， 用 户 可 以 只 关心 要 检索 的 信息 ， 而 无 须 考虑 这 些 信 息 存 储 
在 什么 地 方 。 


国 70 医 。 数据 库 系 统 工程 师 教 程 (第 3 版 ) 


在 Intemet 上 ， 万 维 网 整个 系统 由 Web 服务 器 、Web 浏览 器 (Browser) 和 HTTP 通信 协 
议 三 部 分 组 成 。Web 服务 器 提供 信息 资源 ，Web 浏览 器 将 信息 显示 出 来 , HTTP 是 为 分 布 式 超 
媒体 信息 系统 而 设计 的 一 种 网 络 协议 ， 主 要 用 于 域名 服务 器 和 分 布 式 对 象 管理 ， 它 能 够 传送 任 
意 类 型 数据 对 象 ， 以 满足 Web 服务 器 与 客户 端 之 间 多 媒体 通信 的 需要 ， 从 而 成 为 Internet 中 发 
布 多 媒体 信息 的 主要 协议 。 

统一 资源 定位 器 是 在 WWW 中 标识 某 一 特定 信息 资源 所 在 位 置 的 字符 串 ， 是 一 个 具有 指 
针 作用 的 地 址 标准 。 在 WWW 上 查询 信息 ， 必 不 可 少 的 一 项 操作 是 在 浏览 器 中 输入 查询 目标 的 
地 址 ， 这 个 地 址 就 是 URL， 也 称 Web 地 址 ， 俗 称 “ 网 址 ” 一 个 URL 指定 一 个 远程 服务 器 域 
名 和 一 个 Web 页 。 换言之 ,每 个 Web 页 都 有 唯一 的 URL。URL 也 可 指向 FTP、WAIS 和 gopher 
服务 器 代表 的 信息 。 通 常 ， 用 户 只 需要 了 解 和 使 用 主页 的 URL， 通 过 主页 再 访问 其 他 页 。 当 用 
户 通过 URL 向 WWW 提出 访问 某 种 信息 资源 时 ，WWW 的 客户 服务 器 程序 自动 查找 资源 所 在 
的 服务 器 地 址 ， 一 旦 找到 ， 立 即将 资源 调 出 供用 户 浏览 。 

使 用 WWW 的 浏览 程序 (例如 Internet Explore、Netscape 和 Mosaic 等 )， 网 页 的 超 文本 链 
接 将 引导 用 户 找到 所 需要 的 信息 资源 。 

如 果 已 经 是 Internet 的 用 户 ， 只 要 在 自己 的 计算 机 上 运行 一 个 客户 程序 《WWW 浏览 器 )， 
并 给 出 需 访 问 的 URL 地 址 , 就 可 以 尽情 浏览 这 些 来 自 远方 或 近邻 的 各 种 信息 。- WWW 工作 过 程 为 : 
首先 通过 局 域 网 或 通过 电话 拨号 连 入 Intemet， 并 在 本 地 计算 机 上 运行 WWW 浏览 器 程序 ， 然 
后 根据 想 要 获得 的 信息 来 源 ， 在 浏览 器 的 指定 位 置 输入 WWW 地 址 ， 并 通过 浏览 器 向 Internet 
发 出 请 求 信息 ， 此 时 网 络 中 的 卫 路 由 器 和 服务 器 将 按照 地 址 把 信息 传递 到 所 要 求 的 WWW 服 
务 器 中 , 而 WWW 服务 器 不 断 在 一 个 周知 的 TCP 端口 (端口 号 为 80) 上 侦 听 用 户 的 连接 请 求 ， 
当 服 务 器 接收 到 请 求 后 ， 找 到 所 要 求 的 WWW 页 面 ， 最 后 服务 器 将 找到 的 页 面 通过 Internet 传 
送 回 用 户 的 计算 机 ， 浏 览 器 接收 传 来 的 超 文 本 文件 ， 转 换 并 显示 在 计算 机 屏幕 上 。 

一 个 URL (Web 地 址 ) 包括 以 下 儿 部 分 : 协议 、 主 机 域名 、 端 口号 ( 任 选 )、 目 录 路 径 ( 任 
选 ) 和 一 个 文件 名 《〈 任 选 )。 其 格式 为 : 


scheme://host.Domain[: portJUpath/filename ] 


其 中 ，scheme 指定 服务 连接 的 方式 〈 协 议 )， 通 常 有 下 列 几 种 。 
。 fle: 本 地 计算 机 上 的 文件 。 

。 ”ftp: FTP 服务 器 上 的 文件 。 

。 ”gopher: Gopher 服务 器 上 的 文件 。 

。 http: WWW 服务 器 上 的 超 文 本 文件 。 

。 New: 一 个 USenet 的 新 闻 组 。 

。 telnet: 一 个 Telnet 站 点 。 
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。 ”wais: 一 个 WAIS 服务 器 。 
。 mailto: 发 送 邮件 给 某 人 。 
在 地 址 的 冒号 之 后 通常 是 两 个 反 斜 线 ， 表 示 后 面 是 指定 信息 资源 的 位 置 ， 其 后 是 一 个 可 选 
的 端口 号 ， 地 址 的 最 后 部 分 是 路 径 或 文件 名 。 如 果 端 口号 默认 ， 表 示 使 用 与 某 种 服务 方式 对 应 
的 标准 端口 号 。 根 据 查 询 要 求 不 同 ， 给 出 的 URL 中 目录 路 径 这 一 项 可 有 可 无 。 如 果 在 查询 中 要 求 
包括 文件 路 径 ， 那 么 在 URL 中 就 要 具体 指出 要 访问 的 文件 名 称 。 

下 面 是 一 些 URL 的 例子 : 


http://www.cctv.com/ 中 国 中 央 电 视 台 网 址 
http://www.xjtu.edu.cn/ 西安 交通 大 学 网 址 
ftp://ftp.xjtu.edu.cn/ 西安 交通 大 学 文件 服务 器 
gopher://gopher.xjtu.edu.cn ”西安 交通 大 学 Gopher 服务 器 
5. 文件 传输 服务 


文件 传输 协议 用 来 在 计算 机 之 间 传 输 文件 。 由 于 Internet 是 一 座 装 满 了 各 种 计算 机 文件 的 
宝库 ， 其 中 有 免费 和 共享 的 软件 、 各 种 图 片 、 声 音 、 图 像 和 动画 文件 ,还 有 书籍 和 参考 资料 等 ， 
如 果 希 望 将 它们 下 载 到 你 的 计算 机 上 ， 其 中 最 主要 的 方法 之 一 是 通过 文件 传输 协议 来 实现 ， 因 
此 它 是 Internet 中 广 为 使 用 的 一 种 服务 。 

通常 ， 一 个 用 户 需要 在 FTP 服务 器 中 进行 注册 ， 即 建立 用 户 账号 ， 在 拥有 合法 的 登录 用 户 
名 和 密码 后 ， 才 有 可 能 进行 有 效 的 FTP 连接 和 登录 。 对 于 Internet 中 成 千 上 万 个 FTP 服务 器 来 
说 , 这 就 给 提供 FTP 服务 的 管理 员 带 来 很 大 的 麻烦 , 即 需要 为 每 一 个 使 用 FTP 的 用 户 提供 一 个 
账号 ， 这 样 做 显然 是 不 现实 的 。 实 际 上 ，Internet 的 FTP 服务 是 一 种 匿名 (Anonymous) FTP 
服务 ， 它 设置 了 一 个 特殊 的 用 户 名 一 一 anonymous， 供 公众 使 用 ， 任 何 用 户 都 可 以 使 用 这 个 用 
户 名 与 提供 这 种 匿名 FTP 服务 的 主机 建立 连接 ， 并 共享 这 个 主机 对 公众 开放 的 资源 。 

匿名 FTP 的 用 户 名 是 anonymous， 而 密码 通常 是 guest 或 者 是 使 用 者 的 E-mail 地 址 。 兰 
户 登录 到 匿名 FTP 服务 器 后 ， 其 工作 方式 与 常规 FTP 相同 。 通常 ， 出 于 安全 的 目的 ， 大 多 数 匿 
名 FTP 服务 器 只 允许 下 载 (Download) 文件 ， 而 不 允许 上 传 (Upload) 文件 。 也 就 是 说 ， 用 户 
只 能 从 匿名 FTP 服务 器 复制 所 需 的 文件 ， 而 不 能 将 文件 复制 到 匿名 FTP 服务 器 上 。 此 外 ， 匿 名 
FTP 服务 器 中 的 文件 还 加 入 一 些 保护 性 措施 ， 确 保 这 些 文件 不 能 被 修改 和 删除 ， 同 时 也 可 以 防 
止 计算 机 病毒 的 侵入 。 

FTP 是 基于 客户 端 /服务 器 模式 的 服务 系统 ， 它 由 客户 端 软 件 、 服 务 器 软件 和 FTP 通信 
议 3 部 分 组 成 。FTP 客户 端 软件 运行 在 用 户 计算 机 上 ， 在 用 户 装 入 FTP 客户 端 软件 后 ， 便 可 以 
通过 使 用 FTP 内 部 命令 与 远程 FTP 服务 器 采用 FTP 通信 协议 建立 连接 或 文件 传送 ;FTP 服务 
器 软件 运行 在 远程 主机 上 ， 并 设置 一 个 名 叫 anonymous 的 公共 用 户 账号 ， 向 公众 开放 。 
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FTP 在 客户 端 与 服务 器 的 内 部 建立 两 条 TCP 连接 : 一 条 是 控制 连接 , 主要 月 


参数 〈 端 口号 为 21); 另 一 条 是 数据 连接 ， 主 要 用 于 传送 文件 (端口 号 为 20)。FTP 服务 器 不 


于 传输 命令 和 


断 在 21 号 端口 上 侦 听 用 户 的 连接 请 求 ， 当 用 户 使 用 用 户 名 anonymous 和 密码 guest 或 者 用 户 


E-mail 地 址 进行 登录 时 ， 用 户 即 发 出 连接 请 求 ， 这 样 控制 连接 便 建 立 起 来 ， 此 时 ， 
码 将 通过 控制 连接 发 送 给 服务 器 ;服务 器 接收 到 这 个 请 求 后 ， 便 进行 用 户 识别 ， 然 后 向 客户 回 


送 确认 或 拒绝 的 应 答 信息 ; 用 户 看 到 登录 成 功 的 信息 后 ， 便 可 以 发 出 文件 传输 的 命令 ;服务 器 


户 名 和 密 


从 控制 连接 上 接收 到 文件 名 和 传输 命令 (如 get) 后 ， 便 在 20 号 端口 发 起 数据 连接 ， 并 在 这 个 


连接 上 将 文件 名 所 指明 的 文件 传输 给 客户 。 只 要 用 户 不 使 用 close 或 者 其 


可 以 继续 传输 其 他 文件 。 


5.6 ”信息 安全 基础 知识 


信息 成 为 一 种 重要 的 战略 资源 ， 信 息 的 获取 、 处 理 和 安全 保障 能 力 成 为 一 个 
的 重要 组 成 部 分 ， 信 息 安全 事 关 国家 安全 、 事 关 社 会 稳定 。 信 息 安全 理论 与 技术 


泛 ， 包 括 密码 学 与 信息 加 密 、 可 信 计 算 、 网 络 安全 和 信息 隐藏 等 多 个 方面 。 
1， 信 息 安 全 要 素 


他 命令 关闭 连接 ， 便 


信息 安全 包括 5 个 基本 要 素 ; 机 密 性 、 完 整 性 、 可 用 性 、 可 控 性 与 可 审查 性 。 


机 密 性 : 确保 信息 不 暴露 给 未 授权 的 实体 或 进程 。 


完整 性 : 只 有 得 到 允许 的 人 才能 修改 数据 ， 并 且 能 够 判别 出 数据 是 否 已 被 算 改 。 
可 用 性 : 得 到 授权 的 实体 在 需要 时 可 访问 数据 ， 即 攻击 者 不 能 占用 所 有 的 资源 而 阻碍 


授权 者 的 工作 。 
可 控 性 : 可 以 控制 授权 范围 内 的 信息 流向 及 行为 方式 。 
可 审查 性 : 对 出 现 的 信息 安全 问题 提供 调查 的 依据 和 手段 。 


2. 信息 存储 安全 


信息 的 存储 安全 包括 信息 使 用 的 安全 (如 用 户 的 标识 与 验证 、 用 户 存 取 权 限 
题 跟踪 等 )、 系 统 安全 监控 、 计 算 机 病毒 防治 、 数 据 的 加 密 和 防止 非法 的 攻击 等 。 


1) 


目 户 的 标识 与 验证 


用 户 的 标识 与 验证 主要 是 限制 访问 系统 的 人 员 。 它 是 访问 控制 的 基础 ， 是 对 
法 性 验证 。 方 法 有 两 种 ， 一 是 基于 人 的 物理 特征 的 识别 ， 包 括 签名 识别 法 、 指 纹 识 别 法 和 语音 
二 是 基于 用 户 所 拥有 特殊 安全 物品 的 识别 ， 包 括 智能 IC 卡 识别 法 、 磁 条 卡 识别 法 。 


识别 法 ; 


限制 、 安 全 问 


户 身份 的 合 
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2) 用 户 存 取 权限 限制 
用 户 存 取 权限 限制 主要 是 限制 进入 系统 的 用 户 所 能 做 的 操作 。 存 取 控 制 是 对 所 有 的 直接 存 
取 活 动 通过 授权 进行 控制 以 保证 计算 机 系统 安全 保密 机 制 ， 是 对 处 理 状态 下 的 信息 进行 保护 。 
一 般 有 两 种 方法 : 隔离 控制 法 和 限制 权限 法 。 

(1) 隔离 控制 法 。 隔 离 控 制 法 是 在 电子 数据 处 理 成 分 的 周围 建立 屏障 ， 以 便 在 该 环境 中 实 
施 存 取 规 则 。 隔 离 控制 技术 的 主要 实现 方式 包括 物理 隔离 方式 、 时 间隔 离 方 式 、 逻 辑 隔 离 方式 
和 密码 技术 隔离 方式 等 。 

(2) 限制 权限 法 。 限 制 权限 法 是 有 效 地 限制 进入 系统 的 用 户 所 进行 的 操作 。 即 对 用 户 进行 
分 类 管理 ， 安 全 密级 、 授 权 不 同 的 用 户 分 在 不 同类 别 ; 对 目录 、 文 件 的 访问 控制 进行 严格 的 权 
限 控制 ， 防 止 越权 操作 ;放置 在 临时 目录 或 通信 缓冲 区 的 文件 要 加 密 ， 用 完 尽 快 移 走 或 删除 。 

3) 系统 安全 监控 

系统 必须 建立 一 套 安全 监控 系统 ， 全 面 监控 系统 的 活动 ， 并 随时 检查 系统 的 使 用 情况 ， 一 
旦 有 非法 入 侵 者 进入 系统 ， 能 及 时 发 现 并 采取 相应 措施 ， 确 定 和 堵塞 安全 及 保密 的 漏洞 。 应 当 
建立 完善 的 审计 系统 和 日 志 管理 系统 ， 利 用 日 志和 审计 功能 对 系统 进行 安全 监控 。 管 理 员 还 应 
该 经 常 做 以 下 四 方面 的 工作 。 

(1) 监控 当前 正在 进行 的 进程 ， 正 在 登录 的 用 户 情况 。 

(2) 检查 文件 的 所 有 者 、 授 权 、 修 改 日 期 情况 和 文件 的 特定 访问 控制 属性 。 

(3) 检查 系统 命令 安全 配置 文件 、 口 令 文件 、 核 心 启动 运行 文件 、 任 何 可 执行 文件 的 修改 
情况 。 

(4) 检查 用 户 登 录 的 历史 记录 和 超级 用 户 登录 的 记录 。 如 发 现 异常 ， 及 时 处 理 。 

4) 计算 机 病毒 防治 

计算 机 网 络 服务 器 必须 加 装 网 络 病毒 自动 检测 系统 ， 以 保护 网 络 系统 的 安全 ， 防 范 计算 机 
病毒 的 侵袭 ， 并 且 必须 定期 更 新 网 络 病毒 检测 系统 。 
由 于 计算 机 病毒 具有 隐蔽 性 、 传 染 性 、 潜 伏 性 、 触 发 性 和 破坏 性 等 特点 ， 所 以 需要 建立 计 
算 机 病毒 防治 管理 制度 。 

(1) 经 常 从 软件 供应 商 网 站 下 载 、 安 装 安全 补丁 程序 和 升级 杀毒 软件 。 

(2) 定期 检查 敏感 文件 。 对 系统 的 一 些 敏感 文件 定期 进行 检查 ， 以 保证 及 时 发 现 已 感染 的 
病毒 和 黑客 程序 。 

(3) 使 用 高 强度 的 口令 。 尽 量 选择 难以 猜测 的 口令 ， 对 不 同 的 账号 选用 不 同 的 口令 。 

(4) 经 常备 份 重要 数据 ， 要 做 到 每 天 坚持 备份 。 

(5) 选择 、 安 装 经 过 公安 部 认证 的 防 病毒 软件 ， 定 期 对 整个 硬盘 进行 病毒 检测 、 清 除 工作 。 

(6) 可 以 在 计算 机 和 因特网 之 间 安 装 使 用 防火 墙 ， 提 高 系统 的 安全 性 。 

(7) 当 计算 机 不 使 用 时 ， 不 要 接 入 因特网 ， 一 定 要 断 掉 连接 。 
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(8) 重要 的 计算 机 系统 和 网 络 一 定 要 严格 与 因特网 物理 隔离 。 

(9) 不 要 打开 陌生 人 发 来 的 电子 邮件 ， 无 论 它们 有 多 么 诱 人 的 标题 或 者 附件 ， 同 时 要 小 心 
处 理 来 自 于 熟人 的 邮件 附件 。 

(10) 正确 配置 系统 和 使 用 病毒 防治 产品 。 正 确 配 置 系统 ， 充 分 利用 系统 提供 的 安全 机 制 ， 
提高 系统 防范 病毒 的 能 力 ， 减 少 病毒 侵害 事件 。 了 解 所 选用 防 病毒 产品 的 技术 特点 ， 正 确 配置 
以 保护 自身 系统 的 安全 。 


3. 计算 机 信息 系统 安全 保护 等 级 


《计算 机 信息 系统 安全 保护 等 级 划分 准则 》(GB 17859 一 1999) 规定 了 计算 机 系统 安全 保护 
能 力 的 5 个 等 级 。 

(1) 第 一 级 : 用 户 自 主 保护 级 〈 对 应 TCSEC 的 C1 级 )。 本 级 的 计算 机 信息 系统 可 信 计 算 
基 (Trusted Computing Base) 通过 隔离 用 户 与 数据 ， 使 用 户 具备 自主 安全 保护 的 能 力 。 它 具有 
多 种 形式 的 控制 能 力 ， 对 用 户 实施 访问 控制 ， 即 为 用 户 提供 可 行 的 手段 ， 保 护 用 户 和 用 户 组 信 
息 ， 避 免 其 他 用 户 对 数据 的 非法 读 写 与 破坏 。 

(2) 第 二 级 : 系统 审计 保护 级 (对 应 TCSEC 的 C2 级 )。 与 用 户 自 主 保护 级 相 比 ， 本 级 的 
计算 机 信息 系统 可 信 计 算 机 实施 了 粒度 更 细 的 自主 访问 控制 ， 它 通过 登录 规程 、 审 计 安全 性 相 
关 事件 和 隔离 资源 ， 使 用 户 对 自己 的 行为 负责 。 

(3) 第 三 级 : 安全 标记 保护 级 (对 应 TCSEC 的 B1 级 )。 本 级 的 计算 机 信息 系统 可 信 计 算 
基 具 有 系统 审计 保护 级 所 有 功能 。 此 外 ， 还 提供 有 关 安全 策略 模型 、 数 据 标记 以 及 主体 对 客体 
强制 访问 控制 的 非 形 式 化 描述 ， 具 有 准确 地 标记 输出 信息 的 能 力 ， 消 除 通过 测试 发 现 的 任何 
错误 。 

(4) 第 四 级 : 结构 化 保护 级 (对 应 TCSEC 的 B2 级 )。 本 级 的 计算 机 信息 系统 可 信 计 算 基 
建立 于 一 个 明确 定义 的 形式 化 安全 策略 模型 之 上 ， 它 要 求 将 第 三 级 系统 中 的 自主 和 强制 访问 控 
制 扩展 到 所 有 主体 与 客体 。 此 外 ， 还 要 考虑 隐蔽 通道 。 本 级 的 计算 机 信息 系统 可 信 计 算 基 必须 
结构 化 为 关键 保护 元 素 和 非 关 键 保 护 元 素 。 计 算 机 信息 系统 可 信 计 算 基 的 接口 也 必须 明确 定 
义 ， 使 其 设计 与 实现 能 经 受 更 充分 的 测试 和 更 完整 的 复审 。 它 加 强 了 鉴别 机 制 ;支持 系统 管理 
员 和 操作 员 的 职能 ， 提 供 可 信 设 施 管理 ， 增 强 了 配置 管理 控制 。 系 统 具有 相当 的 抗 渗透 能 力 。 

(5) 第 五 级 : 访问 验证 保护 级 〈 对 应 TCSEC 的 B3 级 )。 本 级 的 计算 机 信息 系统 可 信 计 算 
基 满 足 访问 监控 器 需求 。 访问 监控 器 仲裁 主体 对 客体 的 全 部 访问 。 访问 监控 器 本 身 是 抗 算 改 的 ; 
必须 足够 小 ， 能 够 分 析 和 测试 。 为 了 满足 访问 监控 器 需求 ， 计 算 机 信息 系统 可 信 计 算 基 在 其 构 
造 时 ， 排 除 那些 对 实施 安全 策略 来 说 并 非 必要 的 代码 ; 在 设计 和 实现 时 ， 从 系统 工程 角度 将 其 
复杂 性 降低 到 最 小 程度 。 支 持 安全 管理 员 职 能 ; 扩充 审计 机 制 ， 当 发 生 与 安全 相关 的 事件 时 发 
出 信号 ; 提供 系统 恢复 机 制 。 系 统 具 有 很 高 的 抗 渗透 能 力 。 
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4. 数据 加 密 


数据 加 密 是 防止 未 经 授权 的 用 户 访 问 敏感 信息 的 手段 ， 这 就 是 人 们 通常 理解 的 安全 措施 ， 
也 是 其 他 安全 方法 的 基础 。 研 究 数据 加 密 的 科学 叫 作 密码 学 Cryptography)， 它 又 分 为 设计 密 
码 体 制 的 密码 编码 学 和 破译 密码 的 密码 分 析 学 。 密 码 学 有 着 悠久 而 光辉 的 历史 ， 古 代 的 军事 家 
已 经 用 密码 传递 军事 情报 了 ， 而 现代 计算 机 的 应 用 和 计算 机 科学 的 发 展 又 为 这 一 古老 的 科学 注 
入 了 新 的 活力 。 现 代 密 码 学 是 经 典 密码 学 的 进一步 发 展 和 完善 。 由 于 加 密 和 解密 此 消 彼 长 的 斗 
争 永远 不 会 停止 ， 这 门 科学 还 在 迅速 发 展 之 中 。 

一 般 的 保密 通信 模型 如 图 5-14 所 示 。 


发 送 端 偷 昕 者 接收 端 。 
明文 解密 算法 D 明文 了 
密 文 C=E(IKP) 。 
密 钥 及 密 铀 KK。 
5-14 ”保密 通信 模型 


从 图 5-14 中 可 以 看 出 ， 发 送 端 把 明文 P 用 加 密 算法 E 和 密 钥 K 加 密 ， 变 换 成 密 文 C， 即 
C=E(K, P); 接收 端 利用 解密 算法 D 和 密 钥 K 对 C 解 密 得 到 明文 P， 即 P=D(K, C)。 

这 里 加 /解密 函数 E 和 D 是 公开 的 ， 而 密 钥 K〈 加 解密 函数 的 参数 ) 是 秘密 的 。 在 传送 过 
程 中 偷 听 者 得 到 的 是 无 法 理解 的 密 文 ， 而 他 又 得 不 到 密 钥 ， 这 就 达到 了 对 第 三 者 保密 的 目的 。 

需要 说 明 的 是 ， 不 论 偷 听 者 获取 了 多 少 密 文 ， 但 是 密 文中 没有 足够 的 信息 ， 使 得 可 以 确定 
出 对 应 的 明文 ， 则 这 种 密码 体制 叫 作 是 无 条 件 安全 的 ， 或 称 为 是 理论 上 不 可 破解 的 。 在 无 任何 
限制 的 条 件 下 ， 几 乎 目前 所 有 的 密码 体制 都 不 是 理论 上 不 可 破解 的 。 能 否 破 解 给 定 的 密码 ， 取 
决 于 使 用 的 计算 资源 。 所 以 密码 专家 们 研究 的 核心 问题 就 是 要 设计 出 在 给 定 计算 费 用 的 条 件 
下 ， 计 算 上 《而 不 是 理论 上 ) 安全 的 密码 体制 。 


5.7 ”网络 安全 概述 


由 于 网 络 传播 信息 快捷 ， 隐 项 性 强 ， 在 网 络 上 难以 识别 用 户 的 真实 身份 ， 网 络 犯罪 、 黑 客 
攻击 、 有 害 信息 传播 等 方面 的 问题 日 趋 严重 ， 网 络 安全 已 成 为 网 络 发 展 中 的 一 个 重要 课题 。 网 
络 安全 的 产生 和 发 展 ， 标 志 着 传统 的 通信 保密 时 代 过 渡 到 了 信息 安全 时 代 。 


L 
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1. 网 络 安全 威胁 


一 般 认为 ， 目 前 网 络 存在 的 威胁 主要 表现 在 以 下 5 个 方 

(1) 非 授 权 访 问 : 没有 预先 经 过 同意 ， 就 使 用 网 络 或 计算 机 资源 则 被 看 作 非 授权 访问 ， 如 
有 意 避 开 系 统 访问 控制 机 制 ， 对 网 络 设备 及 资源 进行 非 正 常 使 用 ， 或 擅自 扩大 权限 ， 越 权 访 问 
信息 。 它 主要 有 以 下 几 种 形式 : 假冒、 身份 攻击 、 非 法 用 户 进入 网 络 系统 进行 违法 操作 、 合 法 
用 户 以 未 授权 方式 进行 操作 等 。 

(2) 信息 泄露 或 丢失 : 指 敏感 数据 在 有 意 或 无 意 中 被 泄露 出 去 或 丢失 ， 它 通常 包括 信息 在 
传输 中 丢失 或 泄露 、 信 息 在 存储 介质 中 丢失 或 泄露 以 及 通过 建立 隐蔽 隧道 等 窃取 敏感 信息 等 。 
如 黑客 利用 电磁 泄露 或 拱 线 窃听 等 方式 可 截获 机 密 信息 ， 或 通过 对 信息 流向 、 流 量 、 通 信 频 度 
和 长 度 等 参数 的 分 析 ， 推 测 出 有 用 信息 ， 如 用 户口 令 、 账 号 等 重要 信息 。 

(3) 破坏 数据 完整 性 ， 以 非法 手段 窃 得 对 数据 的 使 用 权 ， 删 除 、 修 改 、 插 入 或 重 发 某 些 重 
要 信息 ， 以 取得 有 益 于 攻击 者 的 响应 ， 恶 意 添加 ， 修 改 数据 ， 以 干扰 用 户 的 正常 使 用 。 

(4) 拒绝 服务 攻击 : 它 不 断 对 网 络 服务 系统 进行 干扰 ， 改 变 其 正常 的 作业 流程 ， 执 行 无 关 
程序 使 系统 响应 减 慢 甚至 瘫痪 ， 影 响 正常 用 户 的 使 用 ， 甚 至 使 合法 用 户 被 排斥 而 不 能 进入 计算 
机 网 络 系统 或 不 能 得 到 相应 的 服务 。 

(5) 利用 网 络 传播 病毒 ， 通 过 网 络 传播 计算 机 病毒 ， 其 破坏 性 大 大 高 于 单机 系统 ， 而 且 用 
户 很 难 防范 。 


2. 网 络 安全 控制 技术 


为 了 保护 网 络 信息 的 安全 可 靠 ， 除 了 运用 法 律 和 管理 手段 外 ， 还 需 依靠 技术 方法 来 实现 。 
网 络 安全 控制 技术 目前 有 防火 墙 技 术 、 加 密 技术 、 用 户 识别 技术 、 访 问 控 制 技术 、 网 络 反 病 毒 
技术 、 网 络 安全 漏洞 扫描 技术 、 入 侵 检测 技术 等 。 

(1) 防火 墙 技术 。 防 火 墙 技术 是 近年 来 维护 网 络 安全 最 重要 的 手段 。 根 据 网 络 信息 保密 程 
度 ， 实 施 不 同 的 安全 策略 和 多 级 保护 模式 。 加 强 防 火 墙 的 使 用 ， 可 以 经 济 、 有 效 地 保证 网 络 安 
全 。 目 前 已 有 不 同 功能 的 多 种 防火 墙 。 但 防火 墙 也 不 是 万 能 的 ， 需 要 配合 其 他 安全 措施 来 协同 
防范 。 

(2) 加 密 技 术 。 加 密 技术 是 网 络 信息 安全 主动 的 、 开 放 型 的 防范 手段 ， 对 于 敏感 数据 应 采 
用 加 密 处 理 ， 并 且 在 数据 传输 时 采用 加 密 传输 ， 目 前 加 密 技 术 主要 有 两 大 类 : 一 类 是 基于 对 称 
密 钥 的 加 密 算 法 ， 也 称 私 钥 算法 ; 另 一 类 是 基于 非 对 称 密 钥 的 加 密 算法 ， 也 称 公 角 算法。 加 密 
手段 一 般 分 软件 加 密 和 硬件 加 密 两 种 。 软 件 加 密 成 本 低 而 且 实 用 灵活 ， 更 换 也 方便 ， 硬 件 加 密 
效率 高 ， 本 身 安全 性 高 。 密 钥 管 理 包括 密 钥 产生 、 分 发 、 更 换 等 ， 是 数据 保密 的 重要 一 环 。 

(3) 用 户 识 别 技术 。 用 户 识别 和 验证 也 是 一 种 基本 的 安全 技术 。 其 核心 是 识别 访问 者 是 否 
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属于 系统 的 合法 用 户 ， 目 的 是 防止 非法 用 户 进入 系统 。 目 前 一 般 采 用 基于 对 称 密 钥 加 密 或 公 
密 钥 加 密 的 方法 ， 采 用 高 强度 的 密码 技术 来 进行 身份 认证 。 比 较 著名 的 有 Kerberos、PGP 等 
方法 。 

(4) 访问 控制 技术 。 访问 控制 是 控制 不 同 用 户 对 信息 资源 的 访问 权限 。 根 据 安全 策略 ， 对 
信息 资源 进行 集中 管理 ， 对 资源 的 控制 粒度 有 粗 粒度 和 细 粒 度 两 种 ， 可 控制 到 文件 、Web 的 
HTML 页 面 、 图 形 、CCT、Java 应 用 。 

(5) 网 络 反 病毒 技术 。 计 算 机 病毒 从 1981 年 首次 被 发 现 以 来 ， 在 近 20 年 的 发 展 过 程 中 ， 
在 数目 和 危害 性 上 都 在 飞速 发 展 。 因 此 ， 计 算 机 病毒 问题 越 来 越 受 到 计算 机 用 户 和 计算 机 反 病 
毒 专家 的 重视 ， 并 且 开 发 出 了 许多 防 病毒 的 产品 。 

(6) 网 络 安全 漏洞 扫描 技术 。 漏 洞 检测 和 安全 风险 评估 技术 ， 可 预知 主体 受 攻击 的 可 能 性 
和 具体 地 指证 将 要 发 生 的 行为 和 产生 的 后 果 。 该 技术 的 应 用 可 以 帮助 分 析 资 源 被 攻击 的 可 能 指 
数 ， 了 解 支撑 系统 本 身 的 脆弱 性 ， 评 估 所 有 存在 的 安全 风险 。 网 络 漏洞 扫描 技术 ， 主 要 包括 网 
络 模拟 攻击 、 漏 洞 检测 、 报 告 服务 进程 、 提 取 对 象 信息 以 及 评测 风险 、 提 供 安全 建议 和 改进 措 
施 等 功能 ， 帮 助 用 户 控 制 可 能 发 生 的 安全 事件 ， 最 大 可 能 地 消除 安全 隐患 。 

(7) 入 侵 检 测 技术 。 入 侵 行为 主要 是 指 对 系统 资源 的 非 授权 使 用 。 它 可 以 造成 系统 数据 的 
丢失 和 破坏 , 可 以 造成 系统 拒绝 合法 用 户 的 服务 等 危害 。 入 侵 者 可 以 是 一 个 手工 发 出 命令 的 人 ， 
也 可 以 是 一 个 基于 入 侵 脚 本 或 程序 的 自动 发 布 命令 的 计算 机 。 入 侵 者 分 为 两 类 : 外 部 入 侵 者 和 
允许 访问 系统 资源 但 又 有 所 限制 的 内 部 入 侵 者 。 内 部 入 侵 者 又 可 分 成 : 假扮 成 其 他 有 权 访 问 敏 
感 数据 用 户 的 入 侵 者 和 能 够 关闭 系统 审计 控制 的 入 侵 者 。 入 侵 检 测 是 一 种 增强 系统 安全 的 有 效 
技术 。 其 目的 就 是 检测 出 系统 中 违背 系统 安全 性 规则 或 者 威胁 到 系统 安全 的 活动 。 检 测 时 ， 通 
过 对 系统 中 用 户 行为 或 系统 行为 的 可 疑 程度 进行 评估 ， 并 根据 评估 结果 来 鉴别 系统 中 行为 的 正 
常 性 ， 从 而 帮助 系统 管理 员 进行 安全 管理 或 对 系统 所 受到 的 攻击 采取 相应 的 对 策 。 


3. 防火 墙 技术 


防火 墙 (Firewall) 是 建立 在 内 外 网 络 边界 上 的 过 滤 封 锁 机 制 ， 它 认为 内 部 网 络 是 安全 和 
可 信赖 的 ， 而 外 部 网 络 是 不 安全 和 不 可 信赖 的 。 防 火 墙 的 作用 是 防止 不 希望 的 、 未 经 授权 地 进 
出 被 保护 的 内 部 网 络 ， 通 过 边界 控制 强化 内 部 网 络 的 安全 策略 。 防 火 墙 作为 网 络 安全 体系 的 基 
础 和 核心 控制 设施 ， 贯 穿 于 受 控 网 络 通信 主干 线 ， 对 通过 受 控 干 线 的 任何 通信 行为 进行 安全 处 
理 ， 如 控制 、 审 计 、 报 警 和 反应 等 ， 同 时 也 承担 着 繁重 的 通信 任务 。 由 于 其 自身 处 于 网 络 系统 
站 和 用 人 生生 二 丰 党 辣 和 种 和 全 会 风 册 因此 ， 选 用 一 个 安全 、 稳 定 和 可 靠 的 防火 墙 产品 ， 
其 重要 性 不 言 而 喻 。 
防火 墙 技术 经 历 了 包 过 滤 、 应 用 代理 网 关 和 状态 检测 技术 三 个 发 展 阶段 。 
1) 包 过 滤 防 火 墙 


T 


几 
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包 过 滤 防 火 墙 一 般 有 一 个 包 检 查 块 〈 通 常 称 为 包 过 滤器 )， 数 据 包 过 滤 可 以 根据 数据 包头 
中 的 各 项 信息 来 控制 站 点 与 站 点 、 站 点 与 网 络 、 网 络 与 网 络 之 间 的 相互 访问 ， 但 无 法 控制 传输 
数据 的 内 容 ， 因 为 内 容 是 应 用 层 数据 ， 而 包 过 滤器 处 在 网 络 层 和 数据 链 路 层 ( 即 TCP 和 下 层 ) 
之 间 。 通 过 检查 模块 ， 防 火 墙 能 够 拦截 和 检查 所 有 出 站 和 进 站 的 数据 ， 它 首先 打开 包 ， 取 出 包 
头 ， 根 据 包头 的 信息 确定 该 包 是 否 符合 包 过 滤 规 则 ， 并 进行 记录 。 对 于 不 符合 规则 的 包 ， 应 进 
行 报警 并 丢弃 该 包 。 

过 滤 型 的 防火 墙 通常 直接 转发 报 文 ， 它 对 用 户 完全 透明 ， 速 度 较 快 。 其 优点 是 防火 墙 对 每 
条 传 入 和 传 出 网 络 的 包 实 行 低 水 平 控制 ， 每 个 卫 包 的 字段 都 被 检查 ， 例 如 源 地 址 、 目 的 地 址 、 
协议 和 端口 等 ; 防火 墙 可 以 识别 和 丢弃 带 欺 骗 性 源 卫 地 址 的 包 ; 包 过 滤 防 火 墙 是 两 个 网 络 之 间 
访问 的 唯一 来 源 ， 包 过 滤 通 常 被 包含 在 路 由 器 数据 包 中 ， 所 以 不 需要 额外 的 系统 来 处 理 这 个 特 
征 。 缺点 是 不 能 防范 黑客 攻击 ， 因 为 网 管 不 可 能 区 分 出 可 信和 网 络 与 不 可 信和 网 络 的 界限 ， 不 支持 
应 用 层 协议 ， 因 为 它 不 识别 数据 包 中 的 应 用 层 协议 ， 访 问 控制 粒度 太 粗 糙 ;， 不 能 处 理 新 的 安全 
威胁 


2) 应 用 代理 网 关 防 火 墙 
应 用 代理 网 关 防 火 墙 彻 底 隔断 内 网 与 外 网 的 直接 通信 ， 内 网 用 户 对 外 网 的 访问 变 成 防火 墙 
对 外 网 的 访问 ， 然 后 再 由 防火 墙 转发 给 内 网 用 户 。 所 有 通信 都 必须 经 应 用 层 代理 软件 转发 ， 访 
问 者 任何 时 候 都 不 能 与 服务 器 建立 直接 的 TCP 连接 , 应 用 层 的 协议 会 话 过 程 必须 符合 代理 的 安 
全 策略 要 求 。 

应 用 代理 网 关 的 优点 是 可 以 检查 应 用 层 、 传 输 层 和 网 络 层 的 协议 特征 ， 对 数据 包 的 检测 能 
力 比较 强 。 缺 点 是 难以 配置 ， 处 理 速度 非常 慢 。 

3) 状态 检测 技术 防火 墙 

状态 检测 技术 防火 墙 结合 了 代理 防火 墙 的 安全 性 和 包 过 滤 防 火 墙 的 高 速度 等 优点 , 在 不 损 
失 安 全 性 的 基础 上 ， 提 高 了 代理 防火 墙 的 性 能 。 

状态 检测 防火 墙 握 弃 了 包 过 滤 防 火 墙 仅 考查 数据 包 的 卫 地 址 等 几 个 参数 而 不 关心 数据 包 
连接 状态 变化 的 缺点 ， 在 防火 墙 的 核心 部 分 建立 状态 连接 表 ， 并 将 进出 网 络 的 数据 当成 一 个 个 
的 会 话 ， 利 用 状态 表 跟 踪 每 一 个 会 话 状态 。 状 态 监测 对 每 一 个 包 的 检查 不 仅 根据 规则 表 ， 更 考 
虑 了 数据 包 是 否 符合 会 话 所 处 的 状态 ， 因 此 提供 了 完整 的 对 传输 层 的 控制 能 力 ， 同 时 也 改进 了 
流量 处 理 速度 。 因 为 它 采 用 了 一 系列 优化 技术 ， 使 防火 墙 性 能 大 幅度 提升 ， 能 应 用 在 各 类 网 络 
环境 中 ， 尤 其 是 在 一 些 规则 复杂 的 大 型 网 络 上 。 
一 个 防火 墙 系统 通常 是 由 过 滤 路 由 器 和 代理 服务 器 组 成 。 过 滤 路 由 器 是 一 个 多 端口 的 人 P 
路 由 器 ， 它 能 够 拦截 和 检查 所 有 出 站 和 进 站 的 数据 。 代 理 服务 器 防火 墙 使 用 一 个 客户 程序 与 特 
定 的 中 间 节 点 《防火 墙 ) 连接 ， 然 后 中 间 节 点 与 期 望 的 服务 器 进行 实际 连接 。 这 样 ， 内 部 与 外 
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网 络 之 间 不 存在 直接 连接 ， 因 此 ， 即 使 防火 墙 发 生 了 问题 ， 外 部 网 络 也 无 法 获得 与 被 保护 的 
络 的 连接 。 典 型 防火 墙 的 体系 结构 分 为 包 过 滤 路 由 器 、 双 宿主 主机 、 屏 蔽 主机 网 关 和 被 屏蔽 
网 等 类 型 。 


4. 入 侵 检 测 与 防御 


入 侵 检测 系统 (Intrusion Detection System，IDS) 作为 防火 墙 之 后 的 第 二 道 安 全 屏障 ， 通 
过 从 计算 机 系统 或 网 络 中 的 若干 关键 点 收集 网 络 的 安全 日 志 、 用 户 的 行为 、 网 络 数据 包 和 审计 
记录 等 信息 并 对 其 进行 分 析 ， 从 中 检查 是 否 有 违反 安全 策略 的 行为 和 遭 到 入 侵 攻 击 的 迹象 ， 入 
侵 检测 系统 根据 检测 结果 ， 自 动 做 出 响应 。IDS 的 主要 功能 包括 对 用 户 和 系统 行为 的 监测 与 分 
析 、 系 统 安全 漏洞 的 检查 和 扫描 、 重 要 文件 的 完整 性 评估 、 己 知 攻击 行为 的 识别 、 异 常 行为 模 
式 的 统计 分 析 、 操 作 系 统 的 审计 跟踪 ， 以 及 违反 安全 策略 的 用 户 行为 的 检测 等 。 入 侵 检 测 通过 
实时 地 监控 入 侵 事件 ， 在 造成 系统 损坏 或 数据 丢失 之 前 阻止 入 侵 者 进一步 的 行动 ， 使 系统 能 尽 
可 能 的 保持 正常 工作 。 与 此 同时 ，IDS 还 需要 收集 有 关 入 侵 的 技术 资料 ， 用 于 改进 和 增强 系统 
抵抗 入 侵 的 能 力 。 

入 侵 检测 系统 有 效 的 弥补 了 防火 墙 系统 对 网 络 上 的 入 侵 行 为 无 法 识别 和 检测 的 不 足 ， 入 侵 
检测 系统 的 部 署 , 使 得 在 网 络 上 的 入 侵 行为 得 到 了 较 好 的 检测 和 识别 , 并 能 够 进行 及 时 的 报警 。 
然而 ， 随 着 网 络 技术 的 不 断 发 展 ， 网 络 攻击 类 型 和 方式 也 在 进行 着 巨大 的 变化 ， 入 侵 检 测 系统 
也 逐渐 地 暴露 出 如 漏 报 、 误 报 率 高 、 灵 活性 差 和 入 侵 响 应 能 力 较 弱 等 不 足 之 处 。 

入 侵 防 御 系统 是 在 入 侵 检测 系统 的 基础 上 发 展 起 来 的 ， 入 侵 防 御 系统 不 仅 能 够 检测 到 网 络 
中 的 攻击 行为 ， 同 时 主动 的 对 攻击 行为 能 够 发 出 响应 ， 对 攻击 进行 防御 。 两 者 相 较 ， 主 要 存在 
以 下 两 种 区 别 。 

(1) 在 网 络 中 的 部 署 位 置 的 不 同 。IPS 一 般 是 作为 一 种 网 络 设备 串 接 在 网 络 中 的 ， 而 IDS 
一 般 是 采用 旁 路 挂 接 的 方式 ， 连 接 在 网 络 中 。 

(2) 入 侵 响 应 能 力 的 不 同 。IDS 设备 对 于 网 络 中 的 入 侵 行 为 ， 往 往 是 采用 将 入 侵 行为 记 
入 日 志 ， 并 向 网 络 管理 员 发 出 警报 的 方式 来 处 理 的 ， 对 于 入 侵 行 为 并 无 主动 的 采取 对 应 措施 ， 
响应 方式 单一 ， 而 入 侵 防御 系统 检测 到 入 侵 行为 后 ， 能 够 对 攻击 行为 进行 主动 的 防御 ， 例 如 丢 
弃 攻 击 连 接 的 数据 包 以 阻 断 攻击 会 话 ， 主 动 发 送 ICMP 不 可 到 达 数 据 包 、 记 录 日 志和 动态 的 生 
成 防御 规则 等 多 种 方式 对 攻击 行为 进行 防御 。 


出 加 慌 
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数据 库 技术 是 研究 数据 库 的 结构 、 存 储 、 设 计 、 管 理 和 应 用 的 一 门 软件 学 科 。 数 据 库 系 统 
本 质 上 是 一 个 用 计算 机 存储 信息 的 系统 。 数 据 库 管 理 系统 是 位 于 用 户 与 操作 系统 之 间 的 一 层 数 
据 管理 软件 ， 其 基本 目标 是 为 用 户 提供 一 个 可 以 方便 、 有 效 地 存 取 数据 库 信息 的 环境 。 数 据 库 
就 是 信息 的 集合 ， 它 是 收集 计算 机 数据 的 仓库 或 容器 ， 用 户 可 以 对 这 些 数据 执行 一 系列 操作 ， 
以 获取 所 需 的 数据 。 设计 数据 库 系统 的 目的 是 为 了 管理 大 量 信息 , 给 用 户 提供 数据 的 抽象 视图 ， 
即 系统 隐藏 有 关 数 据 存储 和 维护 的 某 些 细节 。 对 数据 的 管理 涉及 信息 存储 结构 的 定义 ， 信 息 操 
作 机 制 的 提供 ， 安 全 性 保证 ， 以 及 多 用 户 对 数据 的 共享 问题 。 

本 章 主 要 介绍 一 些 背景 知识 和 基本 概念 ， 使 读者 了 解数 据 库 的 基本 内 容 ， 形 成 数据 库 系 统 
的 总 体 框架 ， 了 解数 据 库 系统 在 计算 机 系统 中 的 地 位 以 及 数据 库 系统 的 功能 。 


6.1 基本 概念 


6.1.1 数据库 与 数据 库 管 理 系 统 


1， 数据 库 系统 基本 概念 


数据 (Data》 是 描述 事物 的 符号 记录 ， 它 具有 多 种 表现 形式 ， 可 以 是 文字 、 图 形 、 图 像 、 
声音 和 语言 等 。 信 息 〈Information) 是 现实 世界 事物 的 存在 方式 或 状态 的 反映 。 信 息 具 有 可 感 
知 、 可 存储 、 可 加 工 、 可 传递 和 可 再 生 等 自然 属性 ， 信 息 已 是 社会 各 行 各 业 不 可 缺少 的 资源 ， 
这 也 是 信息 的 社会 属性 。 数 据 是 信息 的 符号 表示 ， 而 信息 是 具有 特定 释义 和 意义 的 数据 。 

数据 库 系统 (DataBase System，DBS) 是 一 个 采用 了 数据 库 技术 ， 有 组 织 地 、 动 态 地 存储 
大 量 相 关联 数据 ， 方 便 多 用 户 访问 的 计算 机 系统 。 广 义 上 讲 ，DBS 是 由 数据 库 、 硬 件 、 软 件 和 
人 员 组 成 。 

(1) 数据 库 (DataBase，DB)。 它 是 统一 管理 的 、 长 期 储存 在 计算 机 内 的 ， 有 组 织 的 相关 
数据 的 集合 。 其 特点 是 数据 间 联 系 密切 、 元 余 度 小 、 独 立 性 较 高 、 易 扩展 ， 并 且 可 为 各 类 用 户 
共享 。 

(2) 硬件 。 它 是 构成 计算 机 系统 的 各 种 物理 设备 ， 包 括 存储 数据 所 需 的 外 部 设备 。 硬 件 的 
配置 应 满足 整个 数据 库 系 统 的 需要 。 

(3) 软件 。 它 包括 操作 系统 、 数 据 库 管理 系统 及 应 用 程序 。 数 据 库 管理 系统 (DataBase 
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Management System，DBMS ) 是 数据 库 系 统 的 核心 软件 ， 是 由 一 组 相互 关联 的 数据 的 集合 和 一 
组 用 以 访问 这 些 数据 的 软件 组 成 。DBMS 要 在 操作 系统 的 支持 下 工作 ， 解 决 如 何 科学 地 组 织 
储存 数据 ， 如 何 高 效 地 获取 和 维护 数据 的 系统 软件 。 其 主要 功能 包括 数据 定义 功能 、 数 据 操 纵 
功能 、 数 据 库 的 运行 管理 和 数据 库 的 建立 与 维护 。 

(4) 人 员 。 人 员 主 要 有 4 类 。 第 一 类 为 系统 分 析 员 和 数据 库 设计 人 员 ， 系 统 分 析 员 负责 应 
用 系统 的 需求 分 析 和 规范 说 明 ， 他 们 和 用 户 及 数据 库 管理 员 一 起 确定 系统 的 硬件 配置 ， 并 参与 
数据 库 系 统 的 概要 设计 ， 数 据 库 设计 人 员 负 责 数 据 库 中 数据 的 确定 、 数 据 库 各 级 模式 的 设计 。 
第 二 类 为 应 用 程序 员 ， 负 责编 写 使 用 数据 库 的 应 用 程序 ， 这 些 应 用 程序 可 对 数据 进行 检索 、 建 
立 、 删 除 或 修改 。 第 三 类 为 最 终 用 户 ， 他 们 应 用 系统 的 接口 或 利用 查询 语言 访问 数据 库 。 第 四 
类 用 户 是 数据 库 管理 员 (Data Base Administrator，DBA)， 负 责 数 据 库 的 总 体 信息 控制 。DBA 
的 具体 职责 包括 决定 数据 库 中 的 信息 内 容 和 结构 ; 决定 数据 库 的 存储 结构 和 存 取 策 略 ; 定义 数 
据 库 的 安全 性 要 求 和 完整 性 约束 条 件 ; 监控 数据 库 的 使 用 和 运行 ， 数 据 库 的 性 能 改进 、 数 据 库 
的 重组 和 重 构 ， 以 提高 系统 的 性 能 。 


2 数据库 系统 应 用 


数据 库 系 统 的 应 用 很 广泛 ， 典 型 的 应 用 有 : 金融 业 、 销 售 业 、 银 行 、 航 空 业 、 制 造 业 、 人 
力 资源 、 高 校 等 。 数 据 库存 放 各 种 数据 ， 例 如 针对 不 同 应 用 存放 的 数据 如 下 所 述 。 

(1) 金融 业 : 用 于 存储 股票 、 债 券 等 金融 票据 的 买 入 、 卖 出 和 持 有 信息 ; 存储 实时 的 市 场 
信息 ， 以 便于 客户 、 机 构 进行 联机 交易 。 例 如 ， 客 户 可 以 通过 互联 网 直接 与 数据 库 进 行 交 互 ， 
非常 方便 地 进行 股票 和 债券 查询 、 历 史 股票 和 债券 交易 记录 查询 、 股 票 和 债券 实时 交易 等 。 

(2) 销售 业 : 存储 客户 资料 、 商 品 信息 、 买 卖 订单 等 数据 。 用 于 销售 业 的 日 常 运营 管理 ， 
还 可 以 通过 分 析 商 品 的 销售 趋势 ， 为 企业 决策 层 提供 决策 依据 。 例 如 ， 根 据 不 同型 号 的 商品 在 
不 同 的 销售 点 的 销售 情况 ， 为 企业 决策 层 提供 是 否 需 要 进货 ， 进 货 量 等 决策 依据 。 

(3) 银行 业 : 存储 客户 资料 、 账 户 信息 、 贷 款 信息 以 及 交易 记录 。 用 于 银行 业 的 日 常 运营 
管理 ， 通 过 各 种 数据 分 析 还 可 以 为 银行 决策 层 提 供 决策 依据 。 例如, 用户 可 以 通过 自动 取款 机 、 
互联 网 直接 与 数据 库 进 行 交 互 〈 查 询 余额 、 查 询 交易 记录 、 取 款 和 存款 )， 而 银行 也 可 以 根据 
不 同 的 客户 信息 分 析 客户 的 可 信 度 ， 提 供 是 否 可 以 为 客户 贷款 的 依据 。 

(4) 航空 业 : 存储 航班 和 订 票 信息 。 用 于 航空 企业 的 日 常 运营 管理 ， 通 过 各 种 数据 分 析 还 
可 以 为 企业 决策 层 提供 决策 依据 。 例 如 ， 根 据 不 同 的 时 间 段 、 不 同 航线 客流 量 的 大 小 ， 为 企业 
决策 层 提供 是 否 需 要 增设 航班 的 依据 。 

(5) 制造 业 : 存储 产品 、 生 产 信息 、 订 单 信息 、 销 售 商 信息 。 用 于 管理 供应 链 ， 在 保证 企 
业 正 常 运行 的 基础 上 ， 通 过 分 析 产 品 的 销售 趋势 ， 为 企业 决策 层 提 供 决策 依据 。 例 如 ， 根 据 不 
同型 号 的 产品 在 不 同 地 区 的 代理 商 、 经 销 商 的 订货 及 销售 情况 ， 为 企业 决策 层 提 供 某 产品 是 否 
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需要 停产 ， 或 增加 生产 量 ， 或 减少 生产 量 等 决策 依据 。 


(6) 高 校 : 存储 教 职 工 、 薪 资 、 部 门 、 学 4 


6.1.2 数据库 技术 的 发 展 


E、 课 程 、 成 绩 和 科研 项 目 等 信息 。 用 于 管理 教 
职工 教学 、 科 研 以 及 工资 的 发 放 情 况 ， 学 生 选 课 及 成 绩 等 情况 。 


计算 机 的 主要 应 用 之 一 就 是 数据 处 理 ， 将 大 量 的 信息 以 数据 的 形式 存放 在 磁盘 上 。 数 据 处 


理 是 对 各 种 数据 进行 收集 、 存 储 、 加 工 和 传播 的 一 系列 活动 。 数 据 管理 是 数据 处 理 


的 中 心 问题 ， 


是 对 数据 进行 分 类 、 组 织 、 编 码 、 存 储 检 索 和 维护 。 数 据 管理 技术 发 展 经 历 了 三 个 阶段 ， 人 工 


管理 、 文 件 系统 和 数据 库 系 统 阶 段 。 
1， 人 工 管理 阶段 


早期 的 数据 处 理 都 是 通过 手工 进行 的 ， 因 为 当时 的 计算 机 主要 用 于 科学 计算 。 计 算 机 上 没 
有 专门 管理 数据 的 软件 ， 也 没有 诸如 磁盘 之 类 的 设备 来 存储 数据 ， 那 时 应 用 程序 和 数据 之 间 的 


关系 如 图 6-1 所 示 。 

在 人 工 管理 阶段 ， 数 据 处 理 具有 以 下 几 
个 特点 。 

(1) 数据 量 较 少 。 数 据 和 程序 一 一 对 
应 ， 即 一 组 数据 对 应 一 个 程序 ， 数 据 面向 应 
用 ， 独 立 性 很 差 。 由 于 应 用 程序 所 处 理 的 数 
据 之 间 可 能 会 有 一 定 的 关系 ， 故 程序 和 程序 
之 间 就 会 有 大 量 的 重复 数据 。 

(2) 数据 不 保存 。 因 为 在 该 阶段 计算 
机 主要 用 于 科学 计算 ,一 般 不 需要 将 数据 长 
期 保存 ， 只 在 计算 一 个 题目 时 ， 将 数据 输入 
计算 机 ， 算 完 题 ， 得 到 计算 结果 即 可 。 


广 一 | 应 用 程序 1 


厂 一 一 和 数据 组 1 


| 一 一 一 一 | 数据 组 2 


SN 应 用 程序 2 
应 用 程序 3 


应 用 程序 4 


厂 一 一 数据 组 4 


用 户 m 


| 一 | 应 用 程序 n 


数据 组 3 


数据 组 n 


图 6-1 应 用 程序 与 数据 的 关系 


(3) 没有 软件 系统 对 数据 进行 管理 。 程 序 员 不 仅 要 规定 数据 的 逻辑 结构 ， 而 且 在 程序 中 
还 要 设计 物理 结构 ， 包 括 存 储 结构 的 存 取 方法 、 输 入 输出 方式 等 。 也 就 是 说 ， 数 据 对 程序 不 具 


有 独立 性 ， 一 旦 数据 在 存储 器 上 改变 物理 地 址 ， 就 需要 相应 的 改变 用 户 程序 。 


手工 处 理 数据 有 两 个 特点 : 第 一 ， 应 用 程序 之 间 的 依赖 性 太 强 ， 不 独立 ， 第 二 ， 数 据 组 和 
数据 组 之 间 可 能 有 许多 重复 数据 ， 造 成 数据 元 余 。 


2. 文件 系统 阶段 


20 世纪 50 年 代 中 期 以 后 ， 计 算 机 的 硬件 和 软件 飞速 发 展 ， 计 算 机 不 再 只 用 于 科学 计算 的 
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单一 任务 ， 而 可 以 做 一 些 非 数值 数据 的 处 理 。 又 由 于 大 容量 的 磁盘 等 辅助 存储 设备 的 出 现 ， 使 
得 专门 管理 辅助 存储 设备 上 的 数据 的 文件 系统 应 运 而 生 ， 它 是 操作 系统 中 的 一 个 子 系统 。 在 文 
件 系统 中 按 一 定 的 规则 将 数据 组 织 成 为 


个 文件 ， 应 用 程序 通过 文件 系统 对 文件 。 「 用 户 1 二 | 应 用 程序 1 I 
中 的 数据 进行 存 取 和 加 工 。 文 件 系 统 对 数 
所 的 管理 ,实际 上 是 通过 应 用 程序 和 数据 。 | 用户? 儿科 过 2 2 
之 间 的 一 种 接口 实现 的 ， 如 图 6-2 所 示 。 用 户 3 应 用 程序 3 | 数据 文件 3| 
文件 系统 的 最 大 特点 是 解决 了 应 用 应 用 程序 4 数据 文件 4 
程序 和 数据 之 间 的 一 个 公共 接口 问题 ,使 . ; : 
得 应 用 程序 采用 统一 的 存 取 方法 来 操作 [mW TEN ] 数据 文件 1 


数据 。 在 文件 系统 阶段 中 数据 管理 的 特点 
如 下 。 图 6-2 ”应 用 程序 与 文件 的 关系 

(1) 数据 可 以 长 期 保留 ， 数 据 的 逻辑 
结构 和 物理 结构 有 了 区 别 ， 程 序 可 以 按 名 访问 ， 不 必 关 心 数据 的 物理 位 置 ， 由 文件 系统 提供 存 
取 方 法 。 

(2) 数据 不 属于 某 个 特定 的 应 用 ， 即 应 用 程序 和 数据 之 间 不 再 是 直接 的 对 应 关系 ， 可 以 重 
复 使 用 。 但 是 文件 系统 只 是 简单 地 存 取 数 据 ， 相 互 之 间 并 没有 有 机 的 联系 ， 即 数据 存 取 依赖 于 
应 用 程序 的 使 用 方法 ， 不 同 的 应 用 程序 仍然 很 难 共享 同一 数据 文件 。 

(3) 文件 组 织 形式 的 多 样 化 ， 有 索引 文件 、 链 接 文件 和 Hash 文件 等 。 但 文件 之 间 没 有 联 
系 ， 相 互 独立 ， 数 据 间 的 联系 要 通过 程序 去 构造 。 

文件 系统 具有 如 下 缺点 。 

(1) 数据 元 余 (Data Redundancy)。 文 件 与 应 用 程序 密切 相关 ， 相 同 的 数据 集合 在 不 同 的 
应 用 程序 中 使 用 时 ， 经 常 需要 重复 定义 、 重 复 存 储 ， 数 据 元 余 度 大 。 例 如 : 工厂 中 人 事 处 管理 
的 职工 人 事 档 案 ， 生 产科 考勤 系统 的 职工 出 勤 情况 ， 所 用 到 的 数据 很 多 都 是 重复 的 。 这 样 相同 
的 数据 不 能 被 共享 ， 必 然 导 致 数据 的 元 余 。 
(2) 数据 不 一 致 性 (Data Inconsistency)。 由 于 相同 数据 的 重复 存储 ， 单 独 管理 ， 给 数据 的 
修改 和 维护 带 来 难度 ， 容 易 造 成 数据 的 不 一 致 。 例 如 ， 人 事 处 修改 了 某 个 职工 的 信息 ， 但 生产 
科 该 职工 相应 的 信息 没有 修改 ， 造 成 同一 个 职工 的 信息 在 不 同 的 部 门 结果 不 一 样 。 

(3) 数据 孤立 (Data Isolation)， 即 数据 联系 弱 。 由 于 数据 分 散在 不 同 的 文件 中 ， 而 这 些 文 
件 可 能 具有 不 同 的 文件 格式 ， 文 件 之 间 是 孤立 的 ， 从 整体 上 看 没有 反映 现实 世界 事物 之 间 的 内 
在 联系 ， 因 此 很 难 对 数据 进行 合理 的 组 织 以 适应 不 同 应 用 的 需要 。 若 通过 编写 不 同 的 应 用 程序 
来 读 取 所 需 的 数据 ， 则 会 增加 编写 应 用 程序 的 许多 困难 。 
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3. 数据 库 系 统 阶段 


数据 库 系 统 是 由 计算 机 软件 、 硬 件 资源 组 成 的 系统 ， 它 实现 了 有 组 织 地 、 动 态 地 存储 大 量 


关联 数据 ， 方 便 多 用 户 访问 ， 它 与 文件 系统 的 重要 区 别 是 数据 的 充分 


程序 的 高 度 独立 性 。 
数据 库 系 统 阶段 数据 管理 的 特点 如 下 : 
(1) 采用 复杂 的 数据 模型 表示 数据 结构 
之 间 的 联系 。 数 据 不 再 面向 某 个 应 用 ， 而 是 


共享 。 
(2) 有 较 高 的 数据 独立 性 。 
数据 库 也 是 以 文件 方式 存储 数据 的 , 但 


是 它 是 数据 的 一 种 更 高 级 的 组 织 形式 ， 在 应 
用 程序 和 数据 库 之 间 由 DBMS 负责 数据 的 
存 取 。DBMS 对 数据 的 处 理 方式 和 文件 系统 
不 同 ， 它 把 所 有 应 用 程序 中 使 用 的 数据 以 及 
数据 间 的 联系 汇集 在 一 起 ， 以 便于 应 用 程序 
查询 和 使 用 。 这 一 阶段 程序 和 数据 的 关系 如 
图 6-3 所 示 。 

数据 库 系 统 与 文件 系统 的 区 别 是 : 数据 
库 对 数据 的 存储 是 按照 同一 结构 进行 的 ,不 


用 户 1 应 用 程序 1 

用 户 2 人 一 应 用 程序 2 

用 户 3 应 用 程序 3 

应 用 程序 4 

用 户 m 广 一 | 应 用 程序 n 
图 6-3 应 用 程序 


共享 、 交 又 访 问 、 与 应 用 


。 数 据 模型 不 仅 描述 数据 本 身 的 特点 ， 还 描述 数据 
面向 整个 应 用 系统 。 数 据 匈 余 明 显 减 少 ， 实 现 数据 


se 
| 


nn) 数据 库 


与 数据 库 的 关系 


同 的 应 用 程序 都 可 以 直接 操作 这 些 数据 ( 即 对 应 用 程序 的 高 度 独立 性 )。 数 据 库 系统 对 数据 的 
完整 性 、 唯 一 性 和 安全 性 都 提供 一 套 有 效 的 管理 手段 
提供 管理 和 控制 数据 的 各 种 简单 操作 命令 ， 使 用 户 编写 程序 时 容易 掌握 〈 即 操作 方便 性 )。 


4. 数据 库 的 研究 领域 


〈 即 数据 的 充分 


共享 性 )。 数 据 库 系统 还 


数据 库 技术 的 研究 领域 是 十 分 广泛 的 ， 概 括 地 讲 可 包括 以 下 3 个 领域 。 


1) 数据 库 管 理 系统 软件 的 研制 


DBMS 是 数据 库 系统 的 基础 。DBMS 的 研制 包括 研制 DBMS 本 身 以 及 以 DBMS 为 核心 的 
一 组 相互 联系 的 软件 系统 , 包括 工具 软件 和 中 间 件 。 研 制 的 目标 是 提高 系统 的 可 用 性 、 可靠 性 、 


可 伸缩 性 ， 提 高 性 能 和 提高 用 户 的 生产 率 。 


DBMS 核心 技术 的 研究 和 实现 是 数据 库 领 域 所 取得 的 主要 成 就 . DBMS 是 一 个 基础 软件 系 


统 ， 它 提供 了 对 数据 库 中 的 数据 进行 存储 、 检 索 和 管理 


2) 数据 库 设计 


E 的 功能 。 


数据 库 设计 的 主要 任务 是 在 DBMS 的 支持 下 ， 按 照应 用 的 要 求 ， 为 某 一 部 门 或 组 织 设计 
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一 个 结构 合理 、 使 用 方便 效率 较 高 的 数据 库 及 其 应 用 系统 。 其 中 主要 的 研究 方向 是 数据 库 设计 
方法 学 和 设计 工具 ， 包 括 数据 库 设计 方法 、 设 计 工 具 和 设计 理论 的 研究 。 数 据 模型 和 数据 建 模 
的 研究 ， 计 算 机 辅助 数据 库 设 计 方法 及 其 软件 系统 的 研究 ， 数 据 库 设计 规范 和 标准 的 研究 等 。 

3) 数据 库 理论 

数据 库 理论 的 研究 主要 集中 于 关系 的 规范 化 理论 、 关 系数 据 理论 等 。 近 年 来 ， 随 着 计算 机 
网 络 技术 、 人 工 智能 技术 、 并 行 计算 技术 、 分 布 式 计算 技术 、 多 媒体 技术 等 计算 机 领域 中 其 他 
新 兴 技 术 的 发 展 对 数据 库 技术 产生 了 重大 影响 。 数 据 库 技术 和 其 他 计算 机 技术 的 互相 结合 、 互 
相 渗透 ， 使 数据 库 中 新 的 技术 内 容 层 出 不 穷 。 数 据 库 的 许多 概念 、 技 术 内 容 、 应 用 领域 ， 甚 至 
某 些 原理 都 有 了 重大 的 发 展 和 变化 ， 建 立 和 实现 了 一 系列 新 型 数据 库 系 统 ， 如 分 布 式 数据 库 系 
统 、 并 行 数据 库 系 统 、 知 识 库 系统 、 多 媒体 数据 库 系 统 ， 等 等 。 它 们 共同 构成 了 数据 库 系 统 大 
家 族 ， 使 数据 库 技术 不 断 地 涌现 新 的 研究 方向 。 


6.1.3 DBMS 的 功能 和 特点 


DBMS 主要 是 实现 对 共享 数据 有 效 地 组 织 、 管 理 和 存 取 ， 因 此 DBMS 应 具有 如 下 几 个 方 
面 的 功能 及 特征 。 


1. DBMS 功能 


DBMS 功能 主要 包括 数据 定义 、 数 据 库 操作 、 数 据 库 运行 管理 、 数 据 组 织 、 存 储 和 管理 、 
数据 库 的 建立 和 维护 。 

1) 数据 定义 

DBMS 提供 数据 定义 语言 (Data Definition Language，DDL)， 用 户 可 以 对 数据 库 的 结构 描 
述 ， 包 括 外 模式 、 模 式 和 内 模式 的 定义 ;数据 库 的 完整 性 定义 ;安全 保密 定义 ， 如 口令 、 级 别 
和 存 取 权 限 等 。 这 些 定义 存储 在 数据 字典 中 ， 是 DBMS 运行 的 基本 依据 。 

2) 数据 库 操作 

DBMS 向 用 户 提供 数据 操纵 语言 (Data Manipulation Language，DML)， 实 现 对 数据 库 中 
数据 的 基本 操作 ， 如 检索 、 插 入 、 修 改 和 删除 。DML 分 为 两 类 : 宿主 型 和 自 含 型 。 所 谓 宿主 
型 ， 是 指 将 DML 语句 嵌入 某 种 主语 言 (如 C、Java、COBOL 等 ) 中 使 用 ， 自 含 型 是 指 可 以 单 
独 使 用 DML 语句 ， 供 用 户 交互 使 用 。 

3) 数据 库 运 行 管理 

数据 库 在 运行 期 间 多 用 户 环境 下 的 并 发 控制 、 安 全 性 检查 和 存 取 控制 、 完 整 性 检查 和 执行 、 
运行 日 志 的 组 织 管理 、 事 务 管理 和 自动 恢复 等 是 DBMS 的 重要 组 成 部 分 。 这 些 功能 可 以 保证 数 
据 库 系 统 的 正常 运行 。 
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(4) 数据 组 织 、 存 储 和 管理 
DBMS 分 类 组 织 、 存 储 和 管理 各 种 数据 ， 包 括 数 据 字 典 、 用 户 数据 和 存 取 路 径 等 。 要 确定 
以 何 种 文件 结构 和 存 取 方 式 在 存储 级 上 组 织 这 些 数据 ， 以 提高 存 取 效 率 。 实 现 数据 间 的 联系 、 
数据 组 织 和 存储 的 基本 目标 是 提高 存储 空间 的 利用 率 。 
(5) 数据 库 的 建立 和 维护 
数据 库 的 建立 和 维护 包括 数据 库 的 初始 建立 、 数 据 的 转换 、 数 据 库 的 转 储 和 恢复 、 数 据 库 
外 组 和 重 构 、 性 能 监测 和 分 析 等 。 
(6) 其 他 功能 
如 DBMS 与 网 络 中 其 他 软件 系统 的 通信 功能 ， 一 个 DBMS 与 男 一 个 DBMAS 或 文件 系统 
的 数据 转换 功能 等 。 


2. DBMS 的 特点 


通过 DBMS 来 管理 数据 具有 如 下 特点 。 

(1) 数据 结构 化 且 统 一 管理 。 数 据 库 中 的 数据 由 DBMS 统一 管理 。 由 于 数据 库 系统 采 用 
复杂 的 数据 模型 表示 数据 结构 ， 数 据 模型 不 仅 描述 数据 本 身 的 特点 ， 还 描述 数据 之 问 的 联系 。 
数据 不 再 面向 某 个 应 用 ， 而 是 面向 整个 应 用 系统 。 数 据 易 维护 、 易 扩展 ， 数 据 见 余 明 显 减 少 ， 
真正 实现 了 数据 的 共享 。 
(2) 有 较 高 的 数据 独立 性 。 数 据 的 独立 性 是 指数 据 与 程序 独立 ， 将 数据 的 定义 从 程序 中 分 
离 出 去 ， 由 DBMS 负责 数据 的 存储 ， 应 用 程序 关心 的 只 是 数据 的 逻辑 结构 ， 无须 了 解数 据 在 磁 
盘 上 的 数据 库 中 的 存储 形式 ， 从 而 简化 应 用 程序 ， 大 大 减少 应 用 程序 编制 的 工作 量 。 数 据 的 独 
立 性 包括 数据 的 物理 独立 性 和 数据 的 逻辑 独立 性 。 

(3) 数据 控制 功能 。DBMS 提供 了 数据 控制 功能 ， 以 适应 共享 数据 的 环境 。 数据 控 制 功能 
包括 对 数据 库 中 数据 的 安全 性 、 完 整 性 、 并 发 和 恢复 的 控制 。 

。 数据库 的 安全 性 〈Security) 是 指 保护 数据 库 以 防止 不 合法 的 使 用 所 造成 的 数据 泄露 、 

更 改 或 破坏 。 这 样 ， 用 户 只 能 按 规定 对 数据 进行 处 理 ， 例 如 ， 划 分 了 不 同 的 权限 ， 有 
的 用 户 只 能 有 读数 据 的 权限 ， 有 的 用 户 有 修改 数据 的 权限 ， 用 户 只 能 在 规定 的 权限 范 
围 内 操纵 数据 库 。 
。 ”数据 的 完整 性 〈Integrality) 是 指数 据 库 正 确 性 和 相 容 性 ， 是 防止 合法 用 户 使 用 数据 库 

时 向 数据 库 加 入 不 符合 语义 的 数据 。 保 证 数据 库 中 数据 是 正确 的 ， 避 免 非法 的 更 新 。 
。 ”并 发 控制 (Concurrency Control) 是 指 在 多 用 户 共享 的 系统 中 , 许多 用 户 可 能 同时 对 同 

一 数据 进行 操作 。DBMS 的 并 发 控制 子 系统 负责 协调 并 发 事务 的 执行 ， 保 证 数据 库 的 

完整 性 不 受 破坏 ， 避 免 用户 得 到 不 正确 的 数据 。 

。 ”故障 恢复 (RECOVERY From Failure)。 数 据 库 中 的 4 类 故障 是 事务 内 部 故障 、 系 统 故 

障 、 介 质 故 障 及 计算 机 病毒 。 故 障 恢复 主要 是 指 恢复 数据 库 本 身 ， 即 在 故障 引起 数据 
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库 当 前 状态 不 一 致 后 ， 将 数据 库 恢 复 到 某 个 正确 状态 或 一 致 状态 。 恢 复 的 原理 非常 简 
单 ， 就 是 要 建立 见 余 (Redundancy) 数据 。 换 句 话说， 确定 数据 库 是 否 可 恢复 的 方法 
就 是 其 包含 的 每 一 条 信息 是 否 都 可 以 利用 元 余地 存储 在 别处 的 信息 重 构 。 宛 余 是 物理 
级 的 ， 通 常 认为 逻辑 级 是 没有 宛 余 的 。 


3. DBMS 分 类 


DBMS 通常 可 分 为 如 下 三 类 。 

(1) 关系 数据 库 系 统 (Relation DataBase Systems，RDBS)。 关 系数 据 库 系统 是 建立 在 关系 
数据 库 模 型 基础 上 的 数据 库 ， 借 助 于 集合 代数 等 概念 和 方法 来 处 理 数 据 库 中 的 数据 。 目 前 主流 
的 关系 数据 库 有 Oracle、Db2、Sybase、Microsoft SQL Server、Microsoft Access、MySQL 
等 。 在 关系 模型 中 ， 实 体 以 及 实体 间 的 联系 都 是 用 关系 来 表示 的 。 在 一 个 给 定 的 现实 世界 领域 
中 ， 相 应 的 所 有 实体 及 实体 之 间 联 系 的 关系 的 集合 构成 一 个 关系 数据 库 ， 也 有 型 和 值 之 分 。 关 
系数 据 库 的 型 也 称 为 关系 数据 库 模 式 ， 它 是 对 关系 数据 库 的 描述 ， 是 关系 模式 的 集合 。 关 系数 
据 库 的 值 也 称 为 关系 数据 库 ， 是 关系 的 集合 。 关 系数 据 库 模式 与 关系 数据 库 通常 统称 为 关系 数 
据 库 。 

(2) 面向 对 象 的 数据 库 系 统 (Object-Oriented DataBase System，OODBS)。 面 向 对 象 的 数 
据 库 系 统 是 支持 以 对 象形 式 对 数据 建 模 的 数据 库 管 理 系统 ， 包 括 对 对 象 的 类 、 类 属性 的 继承 和 
子 类 的 支持 。 面 向 对 象 数据 库 系 统 主要 有 两 个 特点 : 一 是 面向 对 象 数 据 模型 能 完整 地 描述 现实 
世界 的 数据 结构 ， 能 表达 数据 间 的 嵌 套 、 递 归 联系 ; 二 是 具有 面向 对 象 技术 的 封装 性 和 继承 性 
提高 了 软件 的 可 重用 性 。 

(3) 对 象 关 系数 据 库 系统 (Object-Oriented Relation DataBase System，ORDBS )。 对 象 关 系 
数据 库 系统 是 在 传统 的 关系 数据 模型 基础 上 提供 元 组 、 数 组 、 集 合 等 更 为 丰富 的 数据 类 型 以 及 
处 理 新 的 数据 类 型 操作 的 能 力 ， 这 样 形成 的 数据 模型 被 称 为 “对 象 关 系数 据 模型 ”， 基 于 对 象 
关系 数据 模型 的 DBS 称 为 对 象 关 系数 据 库 系统 。 


6.1.4 ”数据库 系 统 的 体系 结构 


数据 库 系 统 是 数据 密集 型 应 用 的 核心 , 其 体系 结构 受 数据 库 运 行 所 在 的 计算 机 系统 的 影响 
很 大 ， 尤 其 是 受 计算 机 体系 结构 中 的 联网 、 并 行 和 分 布 的 影响 。 站 在 不 同 的 角度 或 不 同 层次 上 
看 ， 数 据 库 系 统 体系 结构 也 不 同 。 站 在 最 终 用 户 的 角度 看 ， 数 据 库 系统 体系 结构 分 为 集中 式 、 
分 布 式 、C/S (客户 端 / 服 务 器 ) 和 并 行 结构 。 


1. 集中 式 数据 库 系统 
分 时 系统 环境 下 的 集中 式 数据 库 系 统 结构 诞生 于 20 世纪 60 年 代 中 期 。 当 时 的 硬件 和 操作 
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系统 决定 了 分 时 系统 环境 下 的 集中 式 数 据 库 系 统 结构 成 为 早期 数据 库 技术 的 首选 结构 。 在 这 种 
系统 中 ， 不 但 数据 是 集中 的 ， 数 据 的 管理 也 是 集中 的 ， 数 据 库 系 统 的 所 有 功能 ， 从 形式 的 用 户 
接口 到 DBMS 核心 都 集中 在 DBMS 所 在 的 计算 机 上 ， 如 图 6-4 所 示 。 目 前 大 多 数 关 系 DBMS 
的 产品 也 是 从 这 种 系统 结构 开始 发 展 的 。 


2. 客户 端 /服务 器 体系 结构 


随 着 网 络 技术 的 迅猛 发 展 ,很 多 现代 软件 都 采用 客户 端 /服务 器 (C/S) 体系 结构 ， 如 图 6-5 
所 示 。 在 这 种 结构 中 ， 一 个 处 理 机 客户 端的 请 求 被 送 到 另 一 个 处 理 机 服务器) 上 执行 。 
其 主要 特点 是 客户 端 与 服务 器 CPU 之 间 的 职责 明确 , 客户 端 主要 负责 数据 表示 服务 , 而 服务 器 


主要 负责 数据 库 服 务 。 
(Cu | Can 
[CD -| Ca> 
(一 -一 
CE 客户 机 1 客户 机 2 客户 机 3 客户 机 n 
图 6-4 集中 式 服 务 器 结构 图 6-5 客户 端 /服务 器 〈C/S) 结构 


采用 C/S 结构 后 ， 数 据 库 系 统 功能 分 为 前 端 和 后 端 。 前 端 主要 包括 图 形 用 户 界面 、 表 格 生 

成 和 报表 处 理 等 工具 ， 后 端 负责 存 取 结构 、 查 询 计 算 和 优化 、 并 发 控制 以 及 故障 恢复 等 。 前 端 
与 后 端 通过 SQL 或 应 用 程序 来 通信 。ODBC (开放 式 数据 库 互 连 ) 和 JDBC 〈Java 程序 数据 库 
连接 ) 标准 定义 了 应 用 程序 和 数据 库 服务 器 通信 的 方法 ， 也 即 定 义 了 应 用 程序 接口 ， 应 用 程序 
用 它 来 打开 与 数据 库 的 连接 、 发 送 查 询 和 更 新 以 及 获取 返回 结果 等 。 数 据 库 服务 器 一 般 可 分 为 
事务 服务 器 和 数据 服务 器 。 
(1) 事务 服务 器 。 事 务 服务 器 也 称 查 询 服 务 器 。 它 提供 一 个 接口 ， 使 得 客户 端 可 以 发 出 执 
行 一 个 动作 的 请 求 , 服务 器 响应 客户 端 请 求 , 并 将 执行 结果 返回 给 客户 端 , 用 户 端 可 以 用 SQL， 
也 可 以 通过 应 用 程序 或 使 用 远程 过 程 调用 机 制 来 表达 请 求 。 一 个 典型 的 事务 服务 器 系统 包括 多 
个 在 共享 内 存 中 访问 数据 的 进程 ， 包 括 服务 器 进程 、 锁 管理 进程 、 写 进程 、 监 视 进 程 和 检查 点 
进程 。 


(2) 数据 服务 器 。 数 据 服 务 器 系统 使 得 客户 端 可 以 与 月 
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有 务 器 交互 ， 以 文件 或 页 面 为 单位 对 


数据 进行 读 取 或 更 新 。 数 据 服 务 器 与 文件 服务 器 相 比 提供 更 强 的 功能 ， 所 支持 的 数据 单位 可 比 
文件 还 要 小 ， 如 页 、 元 组 或 对 象 ， 提供 数据 的 索引 机 制 和 事务 机 制 ， 使 得 客户 端 或 进程 发 生 故 
障 时 数据 也 不 会 处 于 不 一 致 状态 。 


3. 并 行 数据 库 系统 


并 行 体系 结构 的 数据 库 系统 是 多 个 物理 


1) 共享 内 存 式 多 处 理 器 
共享 内 存 式 多 处 理 器 是 指 一 台 计 算 机 上 同时 有 多 个 活动 的 CPU, 它们 共享 单个 内 存 和 一 个 


公共 磁盘 接口 ， 如 图 6-6 所 示 。 这 种 并 行 体系 结构 最 接近 于 
传统 的 单 CPU 处 理 器 结构 ， 其 设计 的 主要 挑战 是 用 N 个 
CPU 来 得 到 N 倍 单 CPU 的 性 能 。 但 是 ， 因 为 不 同 的 CPU | [ceuj [cpuj [eed 


上 连 在 一 起 的 CPU, 而 分 布 式 系统 是 多 个 地 理 上 分 
开 的 CPU。 并 行 体系 结构 的 数据 库 类 型 分 为 共享 内 存 式 多 处 理 器 和 无 共享 式 并 行 体系 结构 。 


对 公共 内 存 的 访问 是 平等 的 ， 这 样 可 能 会 导致 一 个 CPU 被 


访问 的 数据 被 男 一 个 CPU 修改 , 所 以 必须 要 有 特殊 的 处 理 。 


然而 ， 


保证 进行 内 存 划 分 时 不 损失 效率 , 所 以 这 些 共享 内 存 访 问 问 


于 内 存 访问 采用 的 是 一 种 高 速 机 制 , 这 种 机 制 很 难 


题 会 随 着 CPU 个 数 的 增加 而 变 得 难以 解决 。 
2) 无 共享 式 并 行 体系 结构 
无 共享 式 并 行 体系 结构 是 指 一 台 计 算 机 上 同时 有 多 个 活动 的 CPU, 并 且 它 们 都 有 自己 的 内 
存 和 磁盘 ， 如 图 6-7 所 示 ， 图 中 粗 线 表示 高 速 网 络 。 在 不 产生 混淆 的 情况 下 ， 也 称 为 并 行 数据 
库 系 统 。 各 个 承担 数据 库 服务 责任 的 CPU 划分 它们 自身 的 数据 , 通过 划分 的 任务 以 及 通过 每 秒 
兆 位 级 的 高 速 网 络 通信 完成 事务 查询 。 


终 阐 [ 终 凋 | 终 出 [终端 | | 终端 | [终端 


图 6-6 共享 式 多 处 理 器 体系 结构 
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4. 分 布 式 数据 库 系统 


分 布 式 DBMS 包括 物理 上 分 布 、 风 辑 上 集中 的 分 布 式 结构 和 物理 上 分 布 、 逻 辑 上 分 布 的 
分 布 式 数据 库 结构 两 种 。 前 者 的 指导 思想 是 把 单位 的 数据 模式 〈 称 为 全 局 数据 模式 ) 按 数 据 来 
源 和 用 途 ， 合 理 分 布 在 系统 的 多 个 节点 上 ， 使 大 部 分 数据 可 以 就 地 或 就 近 存 取 。 数 据 在 物理 上 
分 布 后 ， 由 系统 统一 管理 ， 使 用 户 不 感到 数据 的 分 布 。 后 者 一 般 由 两 部 分 组 成 : 一 是 本 节点 的 
数据 模式 , 二 是 本 节点 共享 的 其 他 节点 上 有 关 的 数据 模式 。 节 点 间 的 数据 共享 由 双方 协商 确定 。 
这 种 数据 库 结构 有 利于 数据 库 的 集成 、 扩 展 和 重新 配置 。 


6.1.5 ”数据库 系统 的 三 级 模式 结构 
站 在 数据 库 管理 系统 的 角度 看 ， 数 据 库 系统 一 般 采 用 三 级 模式 结构 。 
1， 数据 抽象 


事实 上 ， 一 个 可 用 的 数据 库 系统 必须 能 够 高 效 地 检索 数据 。 这 种 高 效 性 的 需求 促使 数据 库 
设计 者 使 用 复杂 的 数据 结构 来 表示 数据 。 由 于 大 多 数 数据 库 系统 用 户 并 未 受过 计算 机 的 专业 训 
练 ， 因 此 系统 开发 人 员 需 要 通过 如 下 三 个 层次 上 的 抽象 来 对 用 户 屏蔽 系统 的 复杂 性 ， 简 化 用 户 
与 系统 的 交互 。 

1) 物理 层 

物理 层 (Physical Level) 是 最 低层 次 的 抽象 ， 描 述 数据 在 存储 器 是 如 何 存 储 的 。 物 理 层 详 
细 地 描述 复杂 的 底层 结构 。 

2) 逻辑 层 

逻辑 层 (Logical Level) 是 比 物理 层 更 高 一 层 的 抽象 ， 描 述 数据 库 中 存储 什么 数据 以 及 这 
些 数据 间 存 在 什么 关系 。 逻 辑 层 通 过 相对 简单 的 结构 描述 了 整个 数据 库 。 尽 管 逻 辑 层 的 简单 结 
构 的 实现 涉及 了 复杂 的 物理 层 结 构 ， 但 逻辑 层 的 用 户 不 必 知 道 这 些 复杂 性 。 因 为 ， 逻 辑 层 抽象 
是 由 数据 库 管 理 员 的 职责 ， 管 理 员 确定 数据 库 应 保存 哪些 信息 。 

3) 视图 层 

视图 层 〈View Level) 是 最 高 层次 的 抽象 ， 描 述 整 个 数据 库 的 某 个 部 分 。 因 为 数据 库 系 统 
的 很 多 用 户 并 不 关心 数据 库 中 的 所 有 信息 ， 而 只 关心 所 需要 的 那 部 分 数据 。 例 如 ， 某 高 校 信息 
管理 系统 有 人 事 管 理 、 教 务 管理 、 工 资 管理 等 多 个 子 系统 。 但 是 ， 人 事 处 只 关心 与 人 事 管 理 有 
关 的 那 部 分 信息 ， 教 务 处 只 关心 与 教务 管理 有 关 的 那 部 分 信息 ， 财 务 处 只 关心 与 工资 管理 有 关 
的 那 部 分 信息 。 这 些 问 题 可 以 通过 构建 视图 层 实现 ， 这 样 做 除了 使 用 户 与 系统 交互 简化 ， 而 且 
还 可 以 保证 数据 的 保密 性 和 安全 性 。 

作为 数据 库 系 统 设计 员 可 在 视图 层 、 逻 辑 层 和 物理 层 对 数据 抽象 ， 通 过 外 模式 、 概 念 模式 
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和 内 模式 来 描述 不 同 层次 上 的 数据 特性 ， 其 对 应 关系 如 图 6-8 所 示 。 
2. 数据 库 的 三 级 模式 结构 


实际 上 ， 数 据 库 的 产品 很 多 ， 它 们 支持 不 同 的 数据 模型 ， 使 用 不 同 的 数据 库 语言 ， 建 立 在 
不 同 的 操作 系统 上 ， 而 且 数据 的 存储 结构 也 各 不 相同 ， 但 体系 结构 基本 上 都 具有 相同 的 特征 


采用 “三 级 模式 和 两 级 映像 ?。 如 图 6-8 所 示 。 


数据 库 系统 采用 三 级 模式 结构 ， 这 是 数据 库 管理 系统 内 部 的 系统 结构 。 数 据 库 有 “型 ”和 


“ 值 ” 的 概念 ,“ 型 ”是 指 对 某 一 数据 的 结构 和 属性 的 说 明 ,“ 值 ”是 型 的 一 个 具体 赋值 。 
用 户 Al 用 户 A2 用 户 A3 用 户 Bl 用 户 B2 
主语 言 主语 言 主语 言 主语 言 主语 言 
十 DML 十 DML 十 DML 十 DML +DML NM*-- 
Me es pe 一 一 -视图 层 - - 
外 模式 外 部 视图 A 外 部 视图 Br 
外 模式 /概念 模式 外 模式 / 概念 模式 
映 象 A 映 象 B 
由 数据 库 | 一 一 一 一 一 一 一 一 一 ~ se 三 -一 不 一 一 一 逻辑 层 - 
管理 员 建 
数据 库 管 
立 和 维护 概念 模式 概念 视图 理 系 统 
ps DBMS 
概念 模式 /内 模式 映 象 
和 全 1 一 一 一 一 一 一 性 一 一 一 一 一 一 一 一 物理 层 - 
ee 
“| 日 苟同 是 晶 


图 6-8 数据 库 系 统 体系 结构 


3， 模式 
1) 概念 模式 


概念 模式 也 称 模式 ， 是 数据 库 中 全 部 数据 的 逻辑 结构 和 特征 的 描述 ， 它 由 若干 个 概念 记录 
类 型 组 成 ， 只 涉及 型 的 描述 ， 不 涉及 具体 的 值 。 概 念 模式 的 一 个 具体 值 称 为 模式 的 一 个 实例 ， 


同一 个 模式 可 以 有 很 多 实例 。 
概念 模式 反映 的 是 数据 库 的 结构 及 其 联系 ， 所 以 是 相对 稳定 的 ; 而 实例 反映 的 是 数据 


库 某 
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一 时 刻 的 状态 ， 所 以 是 相对 变动 的 。 

需要 说 明 的 是 ， 概 念 模式 不 仅 要 描述 概念 记录 类 型 ， 还 要 描述 记录 间 的 联系 、 操 作 、 数 据 
的 完整 性 和 安全 性 等 要 求 。 但 是 ， 概 念 模式 不 涉及 存储 结构 、 访 问 技术 等 细节 。 只 有 这 样 ， 概 
念 模式 才 算 做 到 了 “物理 数据 独立 性 ”。 

描述 概念 模式 的 数据 定义 语言 称 为 “模式 DDL (Schema Data Definition Language)”。 

2) 外 模式 

外 模式 也 称 用 户 模式 或 子 模 式 ， 是 用 户 与 数据 库 系 统 的 接口 ， 是 用 户 用 到 的 那 部 分 数据 的 
描述 。 它 由 若干 个 外 部 记录 类 型 组 成 。 用 户 使 用 数据 操纵 语言 对 数据 库 进 行 操作 ， 实 际 上 是 对 
外 模式 的 外 部 记录 进行 操作 。 

描述 外 模式 的 数据 定义 语言 称 为 “外 模式 DDL”。 有 了 外 模式 后 ， 程 序 员 不 必 关 心 概念 模 
式 ， 只 与 外 模式 发 生 联系 ， 按 外 模式 的 结构 存储 和 操纵 数据 。 

3) 内 模式 

内 模式 也 称 存储 模 式 ， 是 数据 物理 结构 和 存储 方式 的 描述 ， 是 数据 在 数据 库 内 部 的 表示 方 
式 。 定 义 所 有 的 内 部 记录 类 型 、 索 引 和 文件 的 组 织 方式 ， 以 及 数据 控制 方面 的 细节 。 

例如 ， 记 录 的 存储 方式 是 顺序 存储 ， 按 照 B 树 结构 存储 ， 还 是 Hash 方法 存储 ; 索引 按照 
什么 方式 组 织 ， 数 据 是 否 压 缩 存储 ， 是 否 加 密 ， 数 据 的 存储 记录 结构 有 何 规定 。 

需要 说 明 的 是 ， 内 部 记录 并 不 涉及 物理 记录 ， 也 不 涉及 设备 的 约束 。 比 内 模式 更 接近 于 物 
理 存 储 和 访问 的 那些 软件 机 制 是 操作 系统 的 一 部 分 〈 即 文件 系统 )。 例 如 ， 从 磁盘 上 读 、 写 
数据 。 

描述 内 模式 的 数据 定义 语言 称 为 “内 模式 DDL”。 

总 之 ， 数 据 按 外 模式 的 描述 提供 给 用 户 ， 按 内 模式 的 描述 存储 在 磁盘 上 ， 而 概念 模式 提供 
了 连接 这 两 极 模式 的 相对 稳定 的 中 间 观 点 ， 并 使 得 两 级 的 任意 一 级 的 改变 都 不 受 另 一 级 的 牵制 。 


4， 两 级 映像 


数据 库 系 统 在 三 级 模式 之 间 提供 了 两 级 映像 : 模式 /内 模式 映像 、 外 模式 /模式 映像 。 正 
为 这 两 级 映像 保证 了 数据 库 中 的 数据 具有 较 高 的 逻辑 独立 性 和 物理 独立 性 。 
(1) 模式 /内 模式 的 映像 。 存 在 于 概念 级 和 内 部 级 之 间 ， 实 现 了 概念 模式 到 内 模式 之 间 的 相 


EH 


互 转换 。 

(2) 外 模式 /模式 的 映像 。 存 在 于 外 部 级 和 概念 级 之 间 ， 实 现 了 外 模式 到 概念 模式 之 间 的 相 
互 转换 。 

5. 数据 的 独立 性 


数据 的 独立 性 是 指数 据 与 程序 独立 ， 将 数据 的 定义 从 程序 中 分 离 出 去 ， 由 DBMS 负责 数 
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据 的 存储 ， 从 而 简化 应 用 程序 ， 大 大 减少 应 用 程序 编制 的 工作 量 。 数据 的 独立 性 是 由 DBMS 的 
二 级 映像 功能 来 保证 的 。 数 据 的 独立 性 包括 数据 的 物理 独立 性 和 数据 的 逻辑 独立 性 。 

(1) 数据 的 物理 独立 性 。 它 是 指 当 数据 库 的 内 模式 发 生 改变 时 ， 数 据 的 逻辑 结构 不 变 。 由 
于 应 用 程序 处 理 的 只 是 数据 的 逻辑 结构 , 这 样 物理 独立 性 可 以 保证 , 当 数 据 的 物理 结构 改变 了 ， 
应 用 程序 不 用 改变 。 但是, 为 了 保证 应 用 程序 能 够 正确 执行 ， 需要 修改 概念 模式 /内 模式 之 间 的 
映像 。 

(2) 数据 的 逻辑 独立 性 。 它 是 指 用 户 的 应 用 程序 与 数据 库 的 逻辑 结构 是 相互 独立 的 。 数 据 
的 逻辑 结构 发 生变 化 后 ， 用 户 程序 也 可 以 不 修改 。 但 是 ， 为 了 保证 应 用 程序 能 够 正确 执行 ， 需 
要 修改 外 模式 /概念 模式 之 间 的 映像 。 

【 例 6.1】 数据 库 系 统 设 计 员 可 通过 外 模式 、 概 念 模式 和 内 模式 来 描述 《1) ”次 上 的 
数据 特性 ， 数据库 的 视图 、 基 本 表 和 存储 文件 的 结构 分 别 对 应 (2〉_; 数据 的 物理 独立 性 
和 数据 的 逻辑 独立 性 是 分 别 通过 修改 __(3》_ 的 映像 来 保证 的 。 

(1) A. 视图 层 、 逻 辑 层 和 物理 层 。“”B. 逻辑 层 、 视 图 层 和 物理 层 

C. 物理 层 、 视 图 层 和 风 辑 层 。 D. 物理 层 、 逻 辑 层 和 视图 层 

(2) A. 模式 、 内 模式 、 外 模式 B. 外 模式 、 模 式 、 内 模式 

C. 模式 、 外 模式 、 内 模式 D. 外 模式 、 内 模式 、 模 式 
(2) A. 外 模式 /模式 和 模式 /内 模式 B. 外 模式 /内 模式 和 外 模式 /模式 
C. 模式 /内 模式 和 外 模式 /模式 D. 外 模式 /内 模式 和 模式 /内 模式 

例题 分 析 : 1) 的 正确 选项 为 A。 因 为 ， 作 为 数据 库 系 统 设计 员 可 在 视图 层 、 逻 辑 层 和 物 
理 层 对 数据 抽象 ， 通 过 外 模式 、 概 念 模式 和 内 模式 来 描述 不 同 层次 上 的 数据 特性 。 

(2) 的 正确 选项 为 B。 因 为 ， 数 据 库 通 常 采用 三 级 模式 结构 ， 其 中 视图 对 应 外 模式 、 基 
本 表 对 应 模式 、 存 储 文件 对 应 内 模式 。 

(3) 的 正确 选项 为 C。 因 为 ， 数 据 的 独立 性 是 由 DBMS 的 二 级 映像 功能 来 保证 的 。 数 据 的 
独立 性 包括 数据 的 物理 独立 性 和 数据 的 逻辑 独立 性 。 数 据 的 物理 独立 性 是 指 当 数 据 库 的 内 模式 
发 生 改 变 时 ， 数 据 的 逻辑 结构 不 变 。 为 了 保证 应 用 程序 能 够 正确 执行 ， 需 要 通过 修改 概念 模式 
/内 模式 之 间 的 映像 。 数 据 的 逻辑 独立 性 是 指 用 户 的 应 用 程序 与 数据 库 的 逻辑 结构 是 相互 独立 
的 。 数 据 的 逻辑 结构 发 生变 化 后 ， 用 户 程序 也 可 以 不 修改 。 但 是 ， 为 了 保证 应 用 程序 能 够 正确 
执行 ， 需 要 修改 外 模式 /概念 模式 之 间 的 映像 。 


6.2 ”数据 模型 


6.2.1 数据 模型 的 基本 概念 
模型 就 是 对 现实 世界 特征 的 模拟 和 抽象 ， 数 据 模型 是 对 现实 世界 数据 特征 的 抽象 。 对 于 
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体 的 模型 人 们 并 不 陌生 ， 如 航模 飞机 、 地 图 和 建筑 设计 沙盘 等 都 是 具体 的 模型 。 最 常用 的 数据 
模型 分 为 概念 数据 模型 和 基本 数据 模型 。 

1) 概念 数据 模型 

概念 数据 模型 也 称 为 信息 模型 ， 是 按 用 户 的 观点 对 数据 和 信息 建 模 ， 是 现实 世界 到 信息 世 
界 的 第 一 层 抽象 ,强调 其 语义 表达 功能 ， 易 于 用 户 理解 , 是 用 户 和 数据 库 设 计 人 员 交 流 的 语言 ， 
主要 用 于 数据 库 设 计 。 这 类 模型 中 最 著名 的 是 实体 联系 模型 ， 简 称 E-R 模型 。 

2) 基本 数据 模型 

基本 数据 模型 是 按 计 算 机 系统 的 观点 对 数据 建 模 ， 是 现实 世界 数据 特征 的 抽象 ， 用 于 
DBMS 的 实现 。 不 同 的 数据 模型 具有 不 同 的 数据 结构 形式 ， 目 前 最 常用 的 数据 结构 模型 有 层次 
模型 (Hierarchical Model)、 网 状 模型 (Network Model)、 关 系 模型 (Relational Model) 和 面向 
对 象 数 据 模型 (Object Oriented Model)。 其 中 ， 层 次 模型 和 网 状 模 型 统称 为 非 关 系 模型 。 非 关 
系 模型 的 数据 库 系 统 在 20 世纪 70 年 代 非 常 流行 ， 在 数据 库 系 统 产品 中 占据 了 主导 地 位 。 

关系 数据 库 系 统 是 采用 关系 模型 作为 数据 的 组 织 方式 ， 在 关系 模型 中 用 二 维 表 格 结构 表达 
实体 集 ， 以 及 实体 集 之 间 的 联系 ， 其 最 大 特色 是 描述 的 一 致 性 。 关 系 模型 是 由 若干 个 关系 模式 
组 成 的 集合 。 一 个 关系 模式 相当 于 一 个 记录 型 ， 对 应 于 程序 设计 语言 中 类 型 定义 的 概念 。 关 系 
是 一 个 实例 ， 也 是 一 张 表 ， 对 应 于 程序 设计 语言 中 的 变量 的 概念 。 给 定 变量 的 值 随时 间 可 能 发 
生变 化 ， 类 似 地 ， 当 关系 被 更 新 时 ， 关 系 实例 的 内 容 也 随时 间 发 生 了 变化 。 


6.2.2 ”数据 模型 的 三 要 素 


数据 库 结构 的 基础 是 数据 模型 ， 是 用 来 描述 数据 的 一 组 概念 和 定义 。 数 据 模型 的 三 要 素 是 
数据 结构 、 数 据 操作 和 数据 的 约束 条 件 。 

(1) 数据 结构 。 是 所 研究 的 对 象 类 型 的 集合 ， 是 对 系统 静态 特性 的 描述 。 

(2) 数据 操作 。 对 数据 库 中 各 种 对 象 型 ) 的 实例 〈 值 ) 允许 执行 的 操作 的 集合 ， 包 括 操 
作 及 操作 规则 。 如 操作 有 检索 、 插 入 、 删 除 和 修改 ， 操 作 规则 有 优先 级 别 等 。 数 据 操 作 是 对 系 
统 动态 特性 的 描述 。 

(3) 数据 的 约束 条 件 。 是 一 组 完整 性 规则 的 集合 。 也 就 是 说 ， 对 于 具体 的 应 用 数据 必须 遵 
循 特定 的 语义 约束 条 件 ， 以 保证 数据 的 正确 、 有 效 和 相 容 。 例 如 ， 某 单位 人 事 管理 中 ， 要 求 在 
职 的 “ 男 ”职工 的 年 龄 必须 大 于 18 岁 小 于 60 岁 ， 工 程 师 的 基本 工资 不 能 低 于 1500 元 ， 每 个 
只 工 可 担任 一 个 工种 ， 这 些 要 求 可 以 通过 建立 数据 的 约束 条 件 来 实现 。 


6.2.3”E-R 模型 


概念 模型 是 对 信息 世界 建 模 , 所 以 概念 模型 能 够 方便 、 准 确 地 表示 信息 世界 中 的 常用 概念 。 
概念 模型 有 很 多 种 表示 方法 ， 其 中 最 为 常用 的 是 PP.S.Chen 于 1976 年 提出 的 实体 -联系 方法 
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(Entity Relationship Approach) 。 该 方法 用 E-R 图 来 描述 现实 世界 的 概念 模型 ， 称 为 实体 -联系 
模型 (Entity-Relationship Model，E-R 模型 ) 。 

E-R 模型 是 软件 工程 设计 中 的 一 个 重要 方法 ， 在 数据 库 设 计 中 ， 常 用 E-R 模型 来 描述 现实 
世界 到 信息 世界 的 问题 。 因 为 它 接近 于 人 的 思维 方式 ， 容 易 理解 并 且 与 计算 机 无 关 ， 所 以 用 户 
容易 接受 ,是 用 户 和 数据 库 设 计 人 员 交 流 的 语言 。 但是，E-R 模型 只 能 说 明 实 体 间 的 语义 联系 ， 
还 不 能 进一步 地 详细 说 明 数据 结构 。 在 解决 实际 应 用 问题 时 ， 通 常 应 该 先 设计 一 个 E-R 模型 ， 
然后 再 把 其 转换 成 计算 机 能 接受 的 数据 模型 。 


1， 了 E-R 方法 


概念 模型 中 最 常用 的 方法 为 实体 -联系 方法 ， 简 称 E-R 方法 。 该 方法 直接 从 现实 世界 中 抽 
象 出 实体 和 实体 间 的 联系 ， 然 后 用 非常 直观 的 E-R 图 来 表示 数据 模型 。 在 E-R 图 中 有 表 6-1 所 
示 的 几 个 主要 构件 。 


表 6-1_E-R 图 中 的 主要 构件 


构 件 说 明 
矩形 ”号 表示 实体 集 
双边 征 形 ”四 表示 弱 实 体 集 
绝 形 ”二 > 表示 联系 集 
双边 装 形 一 表示 弱 实 体 集 对 应 的 标识 性 联系 
椭圆 ”三 > 表示 属性 
线段 ”一 将 属性 与 相关 的 实体 集 连 接 ， 或 将 实体 集 与 联系 集 相连 
双 椭 贺 所 二 > 表示 多 值 属性 
虚 椭圆 和 -> 表示 派生 属性 
双 线 ”一 表示 一 个 实体 全 部 参与 到 联系 集中 


在 E-R 图 中 ， 实 体 集中 作为 主 码 (或 主键 ) 的 一 部 分 属性 名 下 面 加 下 画 线 标明 。 另 外 ， 在 
实体 集 与 联系 的 线段 上 标注 联系 的 类 型 。 
需要 说 明 的 是 在 本 书 中 ， 若 不 引起 误解 ， 实 体 集 有 时 简称 实体 ， 联 系 集 有 时 简称 联系 。 


2. 实体 


从 表 6-1 中 可 见 ， 在 E-R 模型 中 实体 用 矩形 表示 ， 通 党 矩形 框 内 写 明 实体 名 。 实 体 是 现实 
世界 中 可 以 区 别 于 其 他 对 象 的 “事件 ”或 “物体 ”。 例 如 ， 企 业 中 的 每 个 人 都 是 一 个 实体 。 每 
个 实体 由 一 组 特性 〈 属 性 ) 来 表示 ， 其 中 的 某 一 部 分 属性 可 以 唯一 标识 实体 ， 如 职工 号 。 实 体 
集 是 具有 相同 属性 的 实体 集合 ， 例 如 ， 学 校 所 有 教师 具有 相同 的 属性 ， 因 此 教师 的 集合 可 以 定 
义 为 一 个 实体 集 ; 学 生 具 有 相同 的 属性 ， 因 此 学 生 的 集合 可 以 定义 为 另 一 个 实体 集 。 
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3， 联系 


在 E-R 模型 中 ， 联 系 用 萎 形 表示 ， 如 表 6-1 所 示 。 通 常 可 在 菱形 框 内 写 明 联 系 名 ， 并 用 无 向 边 
分 别 与 有 关 实 体 连 接 起 来 ， 同 时 在 无 向 边 旁 标注 上 联系 的 类 型 (1 : 1、1 : * 或 * : *)。 实 体 的 联 
系 分 为 实体 内 部 的 联系 和 实体 与 实体 之 间 的 联系 。 实 体内 部 的 联系 反映 数据 在 同一 记录 内 部 各 
字段 间 的 联系 。 
1) 两 个 不 同 实体 之 间 的 联系 
两 个 实体 之 间 的 联系 可 分 为 3 类 : 一 对 一 联系 记 为 1 : 1, 一 对 多 联系 记 为 1 : * (或 1 : n)， 
多 对 多 联系 记 为 * : *(m : n)。 
(1) 1 : 1。 如 果 对 于 实体 集 A 中 的 每 一 个 实体 ， 实 体 集 B 中 至 多 有 一 个 实体 与 之 对 
应 ; 反之 亦 然 ， 则 称 A 与 B 具有 一 对 一 联系 。 
(2) 1 :*。 如 果 对 于 实体 集 A 中 的 每 一 个 实体 ， 实 体 集 B 中 有 个 实体 (n 宇 0) 与 
之 对 应 ; 反之 ， 对 于 实体 集 B 中 的 每 一 个 实体 ， 实 体 集 A 中 至 多 只 有 一 个 实体 与 之 对 应 ， 
则 称 A 与 B 具 有 一 对 多 联系 。 
(3) * : *。 如 果 对 于 实体 集 A 中 的 每 一 个 实体 ， 实 体 集 B 中 及 个 实体 (n 宇 0) 与 
之 对 应 ; 反之 ， 对 于 实体 集 B 中 的 每 一 个 实体 ,实体 集 A 中 也 有 m 个 实体 (m 宇 0) 与 之 对 
应 ， 则 称 A 与 B 具有 多 对 多 联系 。 
例如 : 图 6-9 表示 两 个 不 同 实体 集 之 间 的 联系 ， 其 含义 如 下 。 


图 6-9 (a) 所 示 的 E-R 图 表示 : 电影 院 里 一 个 座 EE pe 
位 只 能 座 一 个 观众 , 因此 观众 与 座位 之 间 是 一 个 1: 1 一 | - 
的 联系 ， 联 系 名 为 “V_S”。 < <b> <> 
图 6-9 (b) 所 示 的 E-R 图 表示 : 部 门 DEPT 和 职 _1 让 
工 EMP 实体 集 , 若 一 个 职工 具 能 属于 一 个 部 门 , 那么 ， | 座位 职工 职工 
这 两 个 实体 集 之 间 应 是 一 个 1 : * 的 联系 ， 联系 名 为 ”11 (bl1:* Co 
“DE”。 图 6-9 两 个 不 同 实体 集 之 间 的 联系 


图 6-9 〈c) 所 示 的 E-R 图 表示 : 工程 项 目 PROJ 和 职工 EMP 实体 集 ， 若 一 个 职工 可 
以 参加 多 个 项 目 ， 一 个 项 目 可 以 由 多 个 职工 参加 ， 那 么 ， 这 两 个 实体 集 之 间 应 是 一 个 * : * 
的 联系 ， 联 系 名 为 “PR_E”。 

2) 两 个 以 上 不 同 实体 集 之 间 的 联系 
两 个 以 上 不 同 实 体 集 之 间 存 在 1 ;1:1、1 :1:*、1 :*:* 和 * :<* :<* 的 联系 。 
例如 ， 图 6-10 表示 了 三 个 不 同 实体 集 之 间 的 联系 。 
图 6-10(a) 表示 供应 商 Supp、 项 目 Proj 和 零件 Part 之 间 的 多 对 多 (* : * : *) 的 联 
系 ， 联 系 名 为 “SP_P”。 表 示 供 应 商 为 多 个 项 目 供应 多 种 零件 ， 每 个 项 目 可 用 多 个 供应 商 
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供应 的 零件 ， 每 种 零件 可 由 不 同 的 供应 商 供应 的 语义 。 
图 6-10 (b) 表示 病房 、 病 人 和 医生 之 间 的 一 对 多 对 多 (1 : * : *) 的 联系 ， 联 系 名 为 
“P_D”。 表示 一 个 特 护 病房 有 多 个 病人 和 多 个 医生 ， 一 个 医生 只 负责 一 个 病房 ， 一 个 病人 


属于 一 个 病房 的 语义 。 


并 


Supp 病房 


* 1 


dN FD ， 


Proj Parl | 病人 医生 


(a)*:*:* (b) 1:*:* 
图 6-10 三 个 不 同 实体 集 之 间 的 联系 


注意 : 三 个 实体 集 之 间 的 多 对 多 的 联系 与 三 个 实体 集 两 两 之 间 的 多 对 多 的 联系 的 语义 是 不 
同 的 。 例 如 ， 供 应 商 和 项 目 实体 集 之 间 的 “合同 ”联系 ， 表 示 供 应 商 为 哪儿 个 工程 签 了 合同 。 
供应 商 与 零件 两 个 实体 集 之 间 的 “库存 ”联系 ， 表 示 供 应 商 库存 零件 的 数量 。 项 目 与 零件 两 个 
实体 集 之 间 的 “组 成 ”联系 ， 表 示 一 个 项 目 有 哪儿 种 零 


件 组 成 。 职工 职工 
3) 同一 实体 集 内 的 二 元 联系 i i i 
同一 实体 集 内 的 各 实体 之 间 也 存在 1 : 1、1 : * 和 9 > 

* ; * 的 联系 ， 如 图 6-11 所 示 。 从 图 中 可 见 ， 职 工 实体 集 Cx | 


中 的 领导 与 被 领导 联系 是 1 : * 的 ， 如 图 6-11 (a) 所 示 。 
但 是 ， 职 工 实体 集中 的 婚姻 联系 是 1 : 1 的 ， 如 图 6-11 
(b) 所 示 。 


4. 属性 


属性 是 实体 某 方面 的 特性 。 例 如 ， 职 工 实体 集 具有 职工 号 、 姓 名 、 年 龄 、 参 加 工作 时 间 和 
通信 地 址 等 属性 。 每 个 属性 都 有 其 取 值 范围 ， 如 职工 号 为 0001 一 9999 的 4 位 整 型 数 ， 姓 名 为 
10 位 的 字符 串 ， 年 龄 的 取 值 范围 为 18 一 60 等 。 在 同一 实体 集中 ， 每 个 实体 的 属性 及 其 域 是 相 
同 的， 但 可 能 取 不 同 的 值 。E-R 模型 中 的 属性 有 如 下 分 类 。 

(1) 简单 属性 和 复合 属性 。 简 单 属 性 是 原子 的 、 不 可 再 分 的 ， 复 合 属性 可 以 细 分 为 更 小 的 
部 分 〈 即 划分 为 别 的 属性 ) 。 有 时 用 户 希 望 访 问 整 个 属性 ， 有 时 希望 访问 属性 的 某 个 成 分 ， 那 
么 在 模式 设计 时 可 采用 复合 属性 。 例如， 职工 实体 集 的 通信 地 址 可 以 进一步 分 为 邮编 、 省 、 市 、 
街道 。 若 不 特别 声明 ， 通 常 指 的 是 简单 属性 。 


图 6-11 同一 实体 集 之 间 的 联系 
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(2) 单 值 属性 和 多 值 属性 。 前 面 所 举 的 例子 中 ， 定 义 的 属性 对 于 一 个 特定 的 实体 都 只 有 
独 的 一 个 值 。 例 如 ， 对 于 一 个 特定 的 职工 ， 只 对 应 一 个 职工 号 、 职 工 姓 名 ， 这 样 的 属性 叫 作 和 
值 属性 。 但 是 ， 在 某 些 特定 情况 下 ， 一 个 属性 可 能 对 应 一 组 值 。 例 如 ， 职 工 可 能 有 0 个 、1 个 
或 多 个 亲属 ， 那 么 职工 的 亲属 的 姓名 可 能 有 多 个 数目 ， 这 样 的 属性 称 为 多 值 属性 。 
(3) NULL 属性 。 当 实体 在 某 个 属性 上 没有 值 或 属性 值 未 知 时 ， 使 用 NULL 值 。 表 示 无 意 
义 或 不 知道 。 
(4) 派生 属性 。 派 生 属 性 可 以 从 其 他 属性 得 来 。 例 如 ， 职 工 实体 集中 有 “参加 工作 时 间 ” 
和 “工作 年 限 ” 属 性 ， 那么 “工作 年 限 ”的 值 可 以 由 当前 时 间 和 参加 工作 时 间 得 到 。 这 里 ，“ 工 
作 年 限 ” 就 是 一 个 派生 属性 。 
【 例 6.2】 设计 关系 模式 时 ,派生 属性 不 会 作为 关系 中 的 属性 来 存储 。 员工 ( 工 号 ,， 姓名， 
性 别 ， 出 生日 期 ， 年 龄 ， 家 庭 地 址 》 关 系 中 ， 派 生 属 性 是 _(》 ; 复合 属性 是 _(2)〉。 
(1) A. 姓名 B. 性 别 C. 出 生日 期 D. 年 龄 
(2) A 工 叶 B. 姓名 C. 家 庭 地 址 D. 出 生日 期 
例题 分 析 : (1) 的 正确 选项 为 D。 因 为 ， 在 概念 设计 中 ， 需 要 概括 企业 应 用 中 的 实体 及 其 
联系 ， 确 定 实体 和 联系 的 属性 。 派 生 属 性 是 指 可 以 由 其 他 属性 进行 计算 来 获得 的 属性 ， 如 年 龄 
是 派生 属性 ， 因 为 该 属性 可 以 由 出 生日 期 、 系 统 当前 时 间 计算 获得 。 若 在 系统 中 存储 派生 属性 ， 
会 引起 数据 宛 余 ， 增 加 额外 存储 和 维护 负担 ， 还 可 能 导致 数据 的 不 一 致 性 。 
(2) 的 正确 选项 为 C。 家 庭 地 址 可 以 进一步 分 为 邮编 、 省 、 市 、 街 道 ， 故 为 复合 属性 。 


5， 扩充 的 E-R 模型 


尽管 基本 的 E-R 模型 是 对 大 多 数 数据 库 特征 建 模 ， 但 数据 库 某 些 情况 下 的 特殊 语义 ， 仅 用 
基本 E-R 模型 无 法 表达 清楚 。 在 这 一 节 中 ， 将 讨论 扩充 的 E-R 模型 ， 包 括 弱 实体 、 特 殊 化 、 概 
括 和 聚集 等 概念 。 

1) 弱 实体 

在 现实 世界 中 有 一 种 特殊 的 依赖 联系 ， 该 联系 是 指 某 实体 是 否 存在 对 于 另 一 些 实体 具有 很 
强 的 依赖 关系 ， 即 一 个 实体 的 存在 必须 以 另 一 个 实体 为 前 提 ， 而 将 这 类 实体 称 为 弱 实 体 。 例 如 
某 企业 职工 与 家 属 的 联系 ， 家 属 总 是 属于 某 职工 的 ， 若 某 职 工 离职 将 其 从 职工 关系 中 删除 ， 家 
属 也 即 随即 删除 ， 那 么 家 属 属 于 “ 弱 实 体 ”， 职 工 与 家 属 之 间 的 “所 属 ” 联 系 属于 依赖 联系 。 

在 扩展 的 E-R 图 中 ， 弱 实体 用 双 线 矩形 框 表示 。 图 6-12 为 职工 与 家 属 的 E-R 图 。 


姓名 加 CS 
1 


图 6-12 弱 实 体 与 依赖 联系 


和 
扯 
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2) 特殊 化 

前 面 已 经 介绍 了 ， 实 体 集 是 具有 相同 属性 的 实体 集合 。 但 在 现实 世界 中 ， 某 些 实体 一 方面 
具有 一 些 共性 ， 另 一 方面 还 具有 各 自 的 特殊 性 。 这 样 ， 一 个 实体 集 可 以 按照 某 些 特征 区 分 为 几 
个 子 实体 。 

设 有 实体 集 E， 如 果 S 是 EE 的 某 些 真 子 集 的 集合 ， 记 为 $={5;15; cE,i=1,2,…,n}， 则 
称 S 是 E 的 一 个 特殊 化 ，E 是 S$、5S,、…、5, 的 超 类 ，S\/、5S,、…、5, 称 为 E 的 子 类 。 


如 果 Us =E， 则 称 S 是 已 的 全 特殊 化 ， 否 则 是 互 的 部 分 特殊 化 。 
i=] 
如 果 5, 站 5, =@,iz 7， 则 S 是 不 相交 特殊 化 ， 否 则 是 重 伏 特殊 化 。 
在 扩充 的 E-R 模型 中 ， 子 类 继承 超 类 的 所 有 属性 和 联系 ， 但 是 ， 子 类 还 有 自己 特殊 的 属性 
和 联系 。 超 类 - 子 类 关系 模型 使 用 特殊 化 圆 图 和 连 线 的 一 般 方式 来 表示 。 超 类 到 圆圈 有 一 条 连 
线 ， 连 线 为 双 线 表示 全 特殊 化 ， 连 线 为 单线 表示 部 分 特殊 化 ， 双 竖 边 矩形 框 表示 子 类 ; 有 符号 
“U ”的 线 表示 特殊 化 ;圆圈 中 的 d 表示 不 相交 特殊 化 ; 圆圈 中 的 。 表示 重合 特殊 化 。 


表 6-2 扩充 E-R 图 中 的 主要 构件 


构 件 说 ”了 明 
一 (由 3- 不 相交 全 特殊 化 ， 即 表示 一 个 实体 全 部 参与 到 联系 集中 
一 由 3- 不 相交 部 分 特殊 化 
一 OO-2- 重合 全 特殊 化 
一 0O-2- 重 关 部 分 特殊 化 
Lj 了 类 


6.，E-R 模型 应 用 举例 


【 例 6.3】 某 学 校 教学 管理 系统 有 5 个 实体 : 系 〈 系 号 ， 系 名 ， 主 任 名 )， 教 师 〈 教 师 号 ， 
教师 名 ， 职 称 )， 学 生 〈 学 号 ， 姓 名 ， 年 龄 ， 性 别 )， 课 程 〈 课 程 号 ， 课 程 名 ， 学 分 )， 项 目 〈 项 
目 写 ， 名 称 ， 负 责 人 )。 若 该 校 有 干 个 系 ， 每 个 系 有 若干 名 教师 和 学 生 ;， 每 个 教师 可 以 担任 若 
干 门 课程 ， 一 门 课程 只 有 一 名 教师 承担 ， 每 个 教师 可 以 参加 多 项 项 目 ， 每 个 项 目 可 由 多 名 教师 
承担 ， 每 个 项 目的 参加 人 有 排名 ; 每 个 学 生 可 以 同时 选修 多 门 课程 ， 一 门 课程 可 由 多 名 学 生 选 
择 。 请 设计 某 学 校 的 教学 管理 的 E-R 模型 。 

例题 分 析 : 

(1) 由 于 每 个 教师 可 以 担任 若干 门 课程 ， 一 门 课 程 只 有 一 名 教师 承担 ， 故 在 教师 和 课程 之 
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间 需 要 建立 一 个 1 : *“ 任 课 ” 联 系 。 

(2) 由 于 教师 参加 多 项 项 目 ， 每 个 项 目 可 由 多 名 教师 承担 ， 故 在 教师 和 项 目 之 间 需 要 建立 
一 个 * : * “参加 ”联系 ;该 联系 需要 增设 一 个 排名 属性 。 

(3) 由 于 每 个 学 生 可 以 同时 选修 多 门 课程 ， 一 门 课程 可 由 多 名 学 生 选 择 ， 故 学 生 和 课程 之 
间 需 要 建立 一 个 * : * “选修” 联系， 其 中 ,“ 选 修 ” 联 系 有 一 个 成 绩 属性 。 

(4) 教师 、 学 生 与 系 之 间 的 所 属 关 系 的 1 : * : * “领导 ”联系 。 

实现 该 学 校 教学 管理 的 E-R 模型 如 图 6-13 所 示 。 

特别 需要 指出 的 是 ，E-R 模型 强调 的 是 语义 ， 与 现实 世界 的 问题 密切 相关 。 这 人 句 话 的 意思 
是 ， 尽 管 都 是 学 校 教学 管理 ， 但 由 于 不 同 的 学 校 教学 管理 的 方法 可 能 会 有 不 同 的 语义 ， 因 此 会 
得 到 不 同 的 E-R 模型 。 


图 6-13 学校 教 学 管理 E-R 模型 


7.， 扩充 E-R 模型 应 用 举例 


【 例 6.4】 假设 某 高 校 学 生 实体 集 可 以 分 为 研究 生 、 本 科 生 、 大 专 生 和 在 职 生 子 集 ; 研究 
生 、 本 科 生 、 大 专 生 和 在 职 生 概 括 为 学 生 ; 将 学 生 、 教 职工 概括 为 人 。 各 实体 情况 叙述 如 下 ， 
请 设计 该 高 校 的 扩充 E-R 图 。 

(1) 学 生 实体 集 用 学 号 标识 ， 并且 有 不 同 的 专业 属性 ,学 生 的 子 实体 包括 研究 生 、 本 科 生 、 
大 专 生 和 在 职 生 。 其 中 : 研究 生 除 了 学 习 外 ， 有 专门 负责 指导 该 研究 生 导 师 ， 还 要 参加 科研 项 
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项 目 有 项 目 号 和 项 目 名 属性 ;本 科 生 有 奖学金 ;专科 生 分 2 年 学 制 和 3 年 学 制 ; 在 职 生 有 
一 定 的 工作 量 要 求 。 

(2) 教 职 工 实体 集 用 职工 号 标识 ， 教 职工 的 子 实体 包括 在 职 生 、 教 师 和 工人 ; 其 中 教师 有 
职称 ， 工 人 不 同 的 工种 。 

例 6.4 分 析 如 下 : 

(1) 学 生 、 教 职工 可 以 概括 为 人 ， 学 生 和 教 职 工 是 实体 集 “ 人 ”的 全 特殊 化 。 提 取 学 生 、 
教 职 工 的 公共 属性 “身份 证 号 、 姓 名 、 性 别 、 生 日 及 联系 方式 ”作为 实体 “人 ”的 属性 。 学 生 
子 类 有 学 号 和 专业 的 特殊 属性 ， 教 职工 子 类 有 职工 号 的 特殊 属性 。 按 照 超 类 - 子 类 扩充 E_R 模 
型 的 表示 方法 ， 超 类 “人 ”到 圆圈 为 双 线 表示 全 特殊 化 。 由 于 有 的 学 生 可 能 为 教 职 工 ， 所 以 超 
类 到 子 类 的 圆圈 内 填写 “o”， 表 示 连 接 的 子 类 有 重合 。 子 类 “学 生 ” 和 “ 教 职 工 ”用 双 竖 线 
矩形 ， 得 到 的 扩充 E_R 图 ， 如 图 6-14 所 示 。 

(2) 学 生 实体 集 可 以 分 为 研究 生 、 本 科 生 、 大 专 生 和 在 职 生 子 类 ， 那么， 研究生 、 本 科 生 、 
大 专 生 和 在 职 生 是 实体 集 “ 学 生 ” 的 特殊 化 。 研 究 生 不 仅 要 继承 学 生 的 所 有 属性 ， 还 要 增加 学 
位 类 型 、 导 师 的 属性 。 作 为 学 生 实体 中 的 研究 生 、 本 科 生 和 大 专 生 子 集 不 相交 即 无 重 瑚 ， 所 以 
超 类 到 子 类 的 圆圈 内 填写 “d”， 表 示 连 接 的 子 类 不 相交 。 子 类 “研究 生 ”“ 本 科 生 ”“ 大 专 
生 ” 和 “在 职 生 ”用 双 竖 线 矩 形 ， 得 到 学 生 与 其 子 类 的 扩充 E_R 图 ， 如 图 6-15 所 示 。 


mn 


身份 证 号 大 


和 专科 后 ]] [| 本科 生 ] 下 研究生] [在 职 生 
(0) 职工 号 


图 6-14 实体 集 “ 人 ”与 子 类 的 扩充 E_R 图 图 6-15 实体 集 “ 学 生 ” 与 子 类 的 扩充 E_R 图 


(3) 教 职 工 实体 集 可 以 分 为 教师 、 工 人 和 在 职 生 子 类 ， 那么 ， 教师 、 工 人 和 在 职 生 是 实体 
集 “ 教 职工 ”的 特殊 化 。 由 于 在 职 生 、 教 师 和 工人 的 集合 等 于 教 职 工 ， 所 以 该 子 类 是 “ 教 职 工 ” 
全 部 特殊 化 。 教 师 、 工 人 和 在 职 生 不 仅 要 继承 教 职 工 的 所 有 属性 ， 教 师 、 工 人 和 在 职 生 分 别 还 
要 增加 职称 、 工 种 和 工作 量 属性 。 又 由 于 有 的 教 职 工 可 能 为 学 生 ， 所 以 超 类 到 子 类 的 圆圈 内 填 
写 “o”， 表 示 连 接 的 子 类 有 重合 。 根 据 上 述 分 析 ， 得 到 教 职 工 与 其 子 类 的 扩充 E_R 图 ， 如 图 
6-16 所 示 。 
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(4) 根据 题 意 研究 生还 需要 参加 项 目 ， 项 目 有 项 目 号 和 项 目 名 属性 ， 所 以 研究 生 与 项 目 之 


间 需 要 增加 “参加 ”联系 。 得 到 研究 生 与 项 目的 E_R 图 ， 如 图 6-17 所 示 。 
教 职 工 
L 
-oy 
在 职 生 AD CT 
图 6-16 实体 集 “ 教 职工 ”与 子 类 的 扩充 E_R 图 图 6-17 研究 生 与 项 目的 ER 图 


通 上 述 分 析 ， 并 将 得 出 的 各 个 扩充 的 分 E-R 图 进行 合并 ， 最 终 得 出 该 高 校 扩 充 的 E-R 图 ， 
如 图 6-18 所 示 。 


图 6-18 ”特殊 化 应 用 实例 
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6.2.4 基本 的 数据 模型 


1. 层次 模型 (Hierarchical Model) 


层次 模型 采用 树 型 结构 表示 数据 与 数据 间 的 联系 。 在 层次 模型 中 ， 每 个 节点 表示 一 个 记录 
类 型 (实体 )， 记 录 之 间 的 联系 用 节点 之 间 的 连 线 表 示 ， 并 且 根 节点 以 外 的 其 他 节点 有 且 仅 有 
一 个 双亲 节点 。 上 层 和 下 一 层 类 型 的 联系 是 1 : n 联系 (包括 1 : 1 联系 )。 

【 例 6.5】 某 商 场 的 部 门 、 员 工 和 商品 三 个 实体 的 PEP 模型 如 图 6-19 所 示 。 在 该 模型 中 ， 
每 个 部 门 有 若干 个 员工 ， 每 个 部 门 负责 销售 的 商品 有 若干 种 ， 即 该 模型 还 表示 部 门 到 员工 之 间 
的 一 对 多 (1 : n) 联系 ， 部 门 到 商品 之 间 的 一 对 多 (1 : n) 联系 。 


部 门 号 | 名 称 | 负责 人 | 电话 


图 6-19 层次 模型 


图 6-19 给 出 的 只 是 PEP 模型 的 “型 ”而 不 是 “ 值 ”。 在 数据 库 中 ， 所 谓 “ 型 ”就 是 数据 
库 模 式 ， 而 “ 值 ”就 是 数据 库 实例 。 模 式 是 数据 库 的 逻辑 设计 ， 而 数据 库 实例 是 给 定时 刻 数 据 
库 中 数据 的 一 个 快照 。 图 6-20 表示 销售 部 的 一 个 实例 。 该 实例 表示 在 某 一 时 刻 销售 部 是 由 李 军 
负责 ， 销 售 部 下 属 有 4 个 员工 ， 负 责 销售 的 商品 有 5 种 。 


002 | 销售 | 李 军 |[ 7276666 


204T 陈 继 军 [销售 员 [ 西 影 路 16 号 | [010021T 鞋 刷 T2.90 | 208 ] 
es 部 | 销售 员 [友谊 路 18 号 010041 取 志 22.90 
2 


202T 高 峰 | 销售 员 [ 太 白 路 2 号 
201 | 张 晓 敏 | 销售 员 | 西 影 路 1 号 


010100 下 80 350 
010001| 钢笔 [ 22.90[ 108 ] 


图 6-20 层次 模型 实例 


层次 模型 不 能 直接 表示 多 对 多 的 联系 。 若 要 表示 多 对 多 的 联系 ， 可 采用 元 余 节 点 法 或 虚拟 
节点 分 解法 。 层 次 模型 的 优点 是 记录 之 间 的 联系 通过 指针 实现 ， 比 较 简单 ， 查 询 效率 高 。 层 次 
模型 的 缺点 是 只 能 表示 1 : n 的 联系 , 尽管 有 许多 辅助 手段 实现 m : n 的 联系 , 但 较 复杂 不 易 掌 
握 ; 由 于 层次 顺序 严格 和 复杂 , 插入 删除 操作 的 限制 比较 多 , 导致 应 用 程序 编制 比较 复杂 。1968 
年 , 美国 IBM 公司 推出 的 IMS 系统 (信息 管理 系统 ) 是 典型 的 层次 模型 系统 ，20 世纪 70 年 代 
在 商业 上 得 到 了 广泛 的 应 用 。 
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2. 网 状 模型 (Network Model) 


采用 网 络 结构 表示 数据 与 数据 间 联 系 的 数据 模型 称 为 网 状 模型 (Network Model)。 在 网 状 
模型 中 ， 人 允许 一 个 以 上 的 节点 无 双亲 ， 一 个 节点 可 以 有 多 于 一 个 的 双亲 。 

网 状 模型 (也 称 DBTG 模型 ) 是 一 个 比 层次 模型 更 具有 普遍 性 的 数据 结构 ， 是 层次 模型 的 
一 个 特例 。 网 状 模型 可 以 直接 地 描述 现实 世界 ， 因 为 去 掉 了 层次 模型 的 两 个 限制 ， 允 许 两 个 节 
点 之 间 有 多 种 联系 〈 称 之 为 复合 联系 )。 

网 状 模型 中 的 每 个 节点 表示 一 个 记录 类 型 (实体 )， 每 个 记录 类 型 可 以 包含 若干 个 字段 (实体 
的 属性 )， 节 点 间 的 连 线 表 示 记 录 类 型 之 间 一 对 多 的 联系 。 层 次 模型 和 网 状 模型 的 主要 区 别 如 下 。 

(1) 网 状 模型 中 子女 节点 与 双亲 节点 的 联系 不 唯一 ， 因 此 需要 为 
每 个 联系 命名 。 

(2) 网 状 模型 允许 复合 链 ， 即 两 个 节点 之 间 有 两 种 以 上 的 联系 
如 图 6-21 所 示 。 

需要 说 明 的 是 ， 网 状 模型 不 能 表示 记录 之 间 的 多 对 多 联系 ， 需 要 
引入 联结 记录 来 表示 多 对 多 联系 。 

【 例 6.6】 假 设 某 高 校 学 生 选课 情况 如 图 6-22 (a) 所 示 , 其 中 , Sno、 
Cno 和 Grade 分 别 表示 学 号 、 课 程 号 和 成 绩 。 请 画 出 采用 网 状 模型 的 学 生 选 课 的 存储 示意 图 。 

例 6.6 分 析 如 下 。 

因为 一 个 学 生 可 以 选 车 干 门 课 , 而 一 门 课 可 以 被 多 个 学 生 选 ， 所 以 学 生 、 课 程 以 及 他 们 之 间 
的 多 对 多 联系 不 能 直接 用 网 状 模型 表示 。 为 此 ， 引 入 选课 联结 记录 ， 如 图 6-22 (b) 所 示 。 这 样 ， 
学 生 与 选课 之 间 的 S-SC 是 一 对 多 联系 ， 课 程 与 选课 之 间 的 C-SC 也 是 一 对 多 联系 。 图 6-22 (b) 
中 ，Sno、Sname、SD、Sage、Cno、Cname、Pcno 和 Grade 分 别 表示 学 号 、 姓 名 、 系 、 年 龄 、 
课程 号 、 课 程 名 、 先 修 课程 号 和 成 绩 。 学 生 选 课 的 存储 示意 图 如 图 6-22 〈c) 所 示 。 

通常 ， 网 状 数据 模型 没有 层次 模型 那样 严格 的 完整 性 约束 条 件 ， 但 DBTG 在 模式 DDL 中 
提供 了 定义 DBTG 数据 库 完整 性 的 若干 概念 和 语句 ， 主 要 有 : 

(1) 支持 记录 码 的 概念 。 码 能 唯一 标识 记录 的 数据 项 的 集合 。 

(2) 保证 一 个 联系 中 双亲 记录 和 子女 记录 之 间 是 一 对 多 联系 。 

(3) 以 支持 双亲 记录 和 子女 记录 之 间 的 某 些 约束 条 件 。 例 如 ， 当 插入 一 条 选课 记录 
“1014，C2，98” 时 ， 只 有 学 生 实体 中 存在 学 号 为 “1014” 的 学 生 记录 ， 课 程 实体 存在 课程 号 
为 “C2” 的 课程 ， 系 统 才 认为 是 合法 的 操作 。 

网 状 模型 的 主要 优点 是 能 更 为 直接 地 描述 现实 世界 ， 具 有 良好 的 性 能 ， 存 取 效 率 高 。 其 主 
要 缺点 是 结构 复杂 。 例 如 ， 当 应 用 环境 不 断 扩 大 时 ， 数 据 库 结构 就 变 得 很 复杂 ， 不 利于 最 终 用 
户 掌握 。 编 制 应 用 程序 难度 比较 大 。DBTG 模型 的 DDL、DML 语言 复杂 ， 记 录 之 间 的 联系 是 


图 6-21 网 状 模型 举例 


第 6 章 数据 库 技 术 基础 “ 国 3o5 荐 


通过 存 取 路 径 来 实现 的 ， 因 此 程序 员 必 须 了 解 系统 结构 的 细节 ， 增 加 了 编写 应 用 程序 的 负担 。 
Sno |Cno [Grade SA 
1001|[ C1| 92 \ 和 
1001| C2| 83 [0 1001 C7 8$ le\ cl 
1001| C3| 88 (ee 
1022| C1| 78 ~、_[rcy Ww、 C3 88 SN Sy 
1073| C3| 80 SY 
3002| C1| 82 py Ci | 1 xX ep 
3003| C2 | 60 10 竹 
(a) 学 生 选 课 情况 ™ [| 证 C3 wy ~ 
到 ZK 
Sno [Snamel SD | Sage Cno [Cname| Peno ps a \ 
007 TT 87 HA C3 
S_SC C_SC 0 入 上 me 
Sno 
(b) 结构 图 (c) 学 生 选 课 存储 示意 图 


图 6-22 学 生 选 课 网 状 数据 库 的 存储 示意 图 


3. 关系 模型 (Relational Model) 


关系 模型 (Relation Model) 是 目前 最 常用 的 数据 模型 之 一 。 关 系数 据 库 系统 采用 关系 模 
型 作为 数据 的 组 织 方式 ， 在 关系 模型 中 用 表格 结构 表达 实体 集 以 及 实体 集 之 问 的 联系 ， 其 最 大 
特色 是 描述 的 一 致 性 。 关 系 模 型 是 由 若干 个 关系 模式 组 成 的 集合 。 一 个 关系 模式 相当 于 一 个 记 
录 型 ， 对 应 于 程序 设计 语言 中 类 型 定义 的 概念 。 关 系 是 一 个 实例 ， 也 是 一 张 表 ， 对 应 于 程序 设 
计 语 言 中 变量 的 概念 。 给 定 变量 的 值 随时 间 可 能 发 生变 化 ， 类 似 地 ， 当 关系 被 更 新 时 ， 关 系 实 
例 的 内 容 也 随时 间 发 生 了 变化 。 

【 例 6.7】 教学 数据 库 的 4 个 关系 模式 如 下 : 

S (Sno,Sname,SD,Sage,Sex) ; 学 生 S 关系 模式 ， 属 性 为 学 号 、 姓 名 、 系 、 年 龄 和 性 别 

T (Tno,Tname,Tage,Sex)  ; 教师 T 关 系 模式 ， 属 性 为 教师 号 、 姓 名 、 年 龄 和 性 别 

C (Cno,CnamePcno) ; 课程 C 关 系 模式 ， 属 性 为 课程 号 、 课 程 名 和 先 修 课 程 号 

SC (Sno,Cno,Grade) ; 学 生 选 课 SC 关系 模式 ， 属 性 为 学 号 、 课 程 号 和 成 绩 

关系 模式 中 有 下 画 线 的 属性 是 主 码 属 性 。 图 6-23 是 教学 模型 的 一 个 具体 实例 。 
由 于 关系 模型 比 网 状 、 层 次 模型 更 为 简单 灵活 ， 因 此 ， 数 据 处 理 领域 中 ， 关 系数 据 库 的 使 
用 已 相当 普遍 。 但 是 ， 现 实 世 界 存在 着 许多 含有 更 复杂 数据 结构 的 实际 应 用 领域 ， 例 如 CAD 
数据 、 图 形 数据 和 人 工 智能 研究 等 ， 需 要 有 一 种 数据 模型 来 表达 这 类 信息 ， 这 种 数据 模型 就 是 
面向 对 象 的 数据 模型 。 


H 
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T 教师 关系 


图 6-23 关系 模型 的 实例 


4. 面向 对 象 数据 模型 (Object Oriented Model) 


j 向 对 象 数据 模型 《Object Oriented Model) 的 核心 概念 如 下 。 


(1) 对 象 和 对 象 标识 (OID)。 对 和 象 是 现实 世界 中 实体 的 模型 化 , 与 记录 、 元 组 的 概念 相似 ， 
但 远 比 它们 复杂 。 每 一 个 对 象 都 有 一 个 唯一 的 标识 ， 称 为 对 象 标识 。 对 象 标识 不 等 于 关系 模式 


中 的 记录 标识 ，OID 是 独立 于 值 的 ， 全 系统 唯一 的 。 


(2) 封装 (Encapsulate)。 每 一 个 对 象 是 状态 (State) 和 行为 《Behavior) 的 封装 。 对 象 的 
状态 是 该 对 象 属性 的 集合 ， 对 象 的 行为 是 在 该 对 象 状态 上 操作 的 方法 〈 程 序 代码 ) 的 集合 。 被 


封装 的 状态 和 行为 在 对 象 外 部 是 看 不 见 的 ， 


只 能 通过 显 式 定义 的 消息 传递 来 访问 。 


(3) 对 象 的 属性 (Object Attribute)。 对 象 的 属性 描述 对 象 的 状态 、 组 成 和 特性 ， 对 象 的 某 


ea 


属性 可 以 是 单 值 或 值 的 集合 。 对 和 象 的 一 个 


属性 值 本 身 在 该 属性 看 来 也 是 一 个 对 象 。 


(4) 类 和 类 层次 (Class and Class Hierarchy)。 
@ 类 。 所 有 具有 相同 属性 和 方法 集 的 对 象 构成 了 一 个 对 象 类 。 任 何 一 个 对 象 都 是 某 个 对 


象 类 的 一 个 实例 (Instance)。 对 象 类 中 属性 


的 定义 域 可 以 是 任何 类 ， 包 括 基本 类 ， 如 整 型 、 实 


型 和 字 串 等 ， 一 般 类 ， 包 含 自 身 属 性 和 方法 类 本 身 。 

@ 类 层次 。 所 有 的 类 组 成 了 一 个 有 根 有 向 无 环 图 ， 称 为 类 层次 〈 结 构 )。 一 个 类 可 以 从 直 
接 / 间 接 祖 先 〈 超 类 ) 中 继承 〈Inherit) 所 有 的 属性 和 方法 ， 该 类 称 为 子 类 。 

(5) 继承 (Inherit)。 子 类 可 以 从 其 超 类 中 继承 所 有 属性 和 方法 。 类 继承 可 分 为 单 继承 〈 即 
一 个 类 只 能 有 一 个 超 类 ) 和 多 重 继承 〈 即 一 个 类 可 以 有 多 个 超 类 )。 


面向 对 象 数据 模型 比 网 络 、 层 次 、 关 系数 据 模 型 具有 更 加 丰富 的 表达 能 力 。 但 正 因为 面向 


对 象 模型 的 丰富 表达 能 力 , 模型 相对 复杂 。 有 关 面 向 对 象 分 析 及 设计 方面 的 内 容 可 参考 第 9 章 。 
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6.3 数据 存储 和 查询 


数据 库 系 统 的 功能 部 件 通常 可 划分 为 存储 管理 器 和 查询 处 理 器 部 件 。 
6.3.1 存储 管理 器 


存储 管理 器 负责 数据 库 中 数据 的 存储 、 检 索 和 更 新 。 在 数据 库 系统 中 ， 存 储 管理 器 是 
存储 底层 数据 和 应 用 程序 ， 以 及 向 数据 库 提交 的 查询 之 间 提供 接口 的 程序 模块 。 存 储 管理 
器 负责 与 文件 系统 交互 ， 将 不 同 的 DML 语句 翻译 成 底层 文件 系统 命令 ， 这 样 原始 数据 就 
通过 文件 系统 存储 在 磁盘 上 。 
存储 管理 器 组 件 包括 : 

(1) 权限 及 完整 性 管理 器 。 检 查 试图 访问 数据 库 用 户 的 权限 ， 检 测 数据 是 否 满足 完 
整 性 约束 。 

(2) 事务 管理 器 。 保 证 一 旦 发 生 了 故障 ， 数 据 库 的 一 致 性 状态 ， 以 及 并 发 事务 执行 
时 不 发 生 冲突 。 

(3) 文件 管理 器 。 管 理 磁盘 空间 的 分 配 ， 管 理 用 于 表示 磁盘 所 有 信息 的 数据 结构 。 

(4) 缓冲 管理 器 。 负 责 将 数据 从 磁盘 放 入 内 存 ， 并 决定 哪些 数据 应 被 缓冲 放 入 内 存 。 


6.3.2 ”查询 处 理 器 


查询 处 理 器 的 组 件 包括 : 

(1) DDL 解释 器 。 解 释 DDL 语句 并 将 其 放 入 数据 字典 中 。 

(2) DML 编译 器 。 将 查询 语言 中 的 DML 语句 翻译 为 一 个 计算 方案 ， 包 括 一 系列 查 
询 计算 引擎 能 理解 的 命令 。 

注意 : 一 个 查询 可 被 解释 为 多 种 等 价 的 具有 相同 结果 的 计算 方案 ，DML 编译 器 还 进 
行 查询 优化 ， 即 从 中 选择 一 种 代价 最 小 的 方案 。 


6.4 数据 仓库 和 数据 挖掘 基础 知识 


信息 技术 的 不 断 推广 应 用 将 企业 带 入 了 信息 爆炸 的 时 代 ， 管 理 者 面 对 着 大 量 的 等 待 处 理 的 
信息 。 这 些 信息 分 为 事务 型 处 理 和 信息 型 处 理 两 大 类 。 事 务 型 处 理 就 是 通常 所 说 的 业务 操作 处 
理 ， 是 对 管理 信息 进行 的 日 常 的 操作 ， 对 信息 进行 查询 和 修改 ， 目 的 是 为 了 满足 组 织 特定 的 日 
常 管理 需要 。 信 息 型 处 理 则 是 对 信息 进一步 的 分 析 ， 为 管理 人 员 决 策 提供 支持 ， 这 类 信息 的 处 
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理 在 现代 企业 中 应 用 越 来 越 广泛 ， 越 来 越 引 起 管理 人 员 的 重视 。 管 理 信息 的 信息 型 处 理 必须 访 
问 大 量 的 历史 数据 才能 完成 ， 不 像 事 务 型 处 理 那样 ， 只 对 当前 的 信息 感 兴趣 。 


6.4.1 数据 仓库 


传统 数据 库 在 联机 事务 处 理 (OLTP) 中 获得 了 较 大 的 成 功 , 但 是 对 管理 人 员 的 决策 分 析 要 
求 却 无 法 满足 。 因 为 管理 人 员 希 望 对 组 织 中 的 大 量 数 据 进行 分 析 ， 了 解 组 织 业务 的 发 展 趋势 
而 传统 的 数据 库 中 只 能 保留 当前 的 管理 信息 ， 缺 乏 决 策 分 析 所 需要 的 大 量 的 历史 信息 。 为 了 满 
足 管理 人 员 的 决策 分 析 需 要 ， 在 数据 库 基础 上 产生 了 能 满足 决策 分 析 需 要 的 数据 环境 一 一 数据 
仓库 (Data Warehouse，DW )。 
虽然 数据 仓库 是 从 数据 库 发 展 而 来 的 ， 但 是 二 者 在 许多 方面 有 相当 大 的 差异 ， 二 者 的 比较 
情况 如 表 6-3 所 示 。 


表 6-3 ”数据 仓库 与 数据 库 比 较 


内 容 数 据 仓库 
数据 内 容 历史 的 、 存 档 的 、 归 纳 的 、 计 算 的 


数据 目标 面向 业务 操作 人 员 ， 重 复 处 理 面向 主题 域 、 分 析 应 用 


数据 特性 动态 变化 ， 按 字段 更 新 Fe 不 能 直接 更 新 ， 只 能 定时 添加 、 


数据 结构 高 度 结构 化 、 复 杂 、 适 合 操作 计算 | 简单 、 适 合 分 析 


使 用 频率 中 、 低 
数据 访问 量 每 个 事务 只 访问 少量 的 记录 有 的 事务 可 能 需要 访问 大 量 的 记录 


对 响应 时 间 的 要 求 ”| 以 秒 为 单位 计算 以 秒 、 分 钟 、 甚 至 小 时 为 计算 单位 
1. 数据 仓库 的 基本 特性 


数据 仓库 有 这 样 一 些 重要 的 特性 : 面向 主题 的 、 数 据 是 集成 的 、 数 据 是 相对 稳定 的 、 数 据 
是 反应 历史 变化 的 。 

1) 面向 主题 的 

数据 仓库 中 数据 是 面向 主题 进行 组 织 的 。 从 信息 管理 的 角度 来 看 ， 主 题 就 是 一 个 较 高 的 管 
理 层次 上 对 信息 系统 中 数据 按照 某 一 具体 的 管理 对 象 进行 综合 、 归 类 所 形成 的 分 析 对 象 。 从 数 
据 组 织 的 角度 来 看 ， 主 题 就 是 一 些 数据 集合 ， 这 些 数 据 集合 对 分 析 对 象 进行 了 比较 完整 的 、 一 
致 的 数据 描述 ， 这 种 数据 描述 不 仅 涉及 数据 自身 ， 还 涉及 数据 间 的 联系 。 例 如 ， 企 业 中 的 客户 、 
产品 和 供应 商 等 都 可 以 作为 主题 来 看 待 。 

数据 仓库 的 创建 使 用 都 是 围绕 主题 实现 的 , 因此 , 必须 了 解 如 何 按照 决策 分 析 来 抽取 主题 ， 
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所 抽取 的 主题 应 该 包含 哪些 数据 内 容 ， 这 些 数据 应 该 如 何 组 织 。 在 进行 主题 抽取 时 ， 必 须 按照 
决策 分 析 对 象 进行 。 例如 , 在 企业 销售 管理 中 的 管理 人 员 所 关心 的 是 本 企业 哪些 产品 销售 量 大 、 
利润 高 ? 哪些 客户 采购 的 产品 数量 多 ? 竞争 对 手 的 哪些 产品 对 本 企业 产品 构成 威胁 ?根据 这 
些 管 理 决策 分 析 对 象 ， 就 可 以 抽取 “产品 ”“ 客 户 ” 等 主题 。 
2) 数据 是 集成 的 
数据 仓库 的 集成 性 是 指 根据 决策 分 析 的 要 求 ， 将 分 散 于 各 处 的 原 数据 进行 抽取 、 筛 选 、 清 
E、 综 合 等 集成 工作 ， 使 数据 仓库 中 的 数据 具有 集成 性 。 
数据 仓库 所 需要 的 数据 不 像 业务 处 理 系 统 那 样 直接 从 业务 发 生地 获取 数据 。 如 在 线 事务 处 
理 系 统 (OLPT)、 企 业 业 务 流程 重组 (BRP) 以 及 基于 因特网 的 电子 商务 (EC) 中 的 数据 是 与 
业务 处 理 联系 在 一 起 的 ， 只 为 业务 的 日 常 处 理 服务 ， 而 不 是 为 决策 分 析 服 务 。 这 样 ， 数 据 仓库 
在 从 业务 处 理 系统 那里 获取 数据 时 ， 并 不 能 将 原 数据 库 中 的 数据 直接 加 载 到 数据 仓库 中 ， 而 要 
进行 一 系列 的 数据 预 处 理 。 即 从 原 数据 库 中 挑选 出 数据 仓库 所 需要 的 数据 ， 然 后 将 来 自 不 同 数 
据 库 中 的 数据 按 某 一 标准 进行 统一 ， 如 将 数据 源 中 数据 的 单位 、 字 长 与 内 容 统一 起 来 ， 将 源 数 
据 中 字段 的 同名 异 义 、 异 义 同名 现象 消除 ， 然 后 将 源 数据 加 载 到 数据 仓库 ， 并 将 数据 仓库 中 的 
数据 进行 某 种 程度 的 综合 ， 进 行 概括 和 聚集 的 处 理 。 
3) 数据 是 相对 稳定 的 
数据 仓库 的 数据 主要 是 供 决策 分 析 之 用 ， 所 涉及 的 数据 操作 主要 是 数据 查询 ， 一 般 情 况 下 
并 不 进行 修改 操作 。 数 据 仓 库 的 数据 反映 的 是 一 段 相当 长 的 时 间 内 历史 数据 的 内 容 ， 是 不 同时 
间 的 数据 库 快 照 的 集合 ， 以 及 基于 这 些 快照 进行 统计 、 综 合 和 重组 的 导出 数据 ， 而 不 是 联机 处 
理 的 数据 。 数 据 库 中 进行 联机 处 理 的 数据 经 过 集成 输入 到 数据 仓库 中 。 因 为 数据 仓库 只 进行 数 
居 查 询 操作 ， 所 以 在 DBMS 中 的 完整 性 保护 、 并 发 控制 在 数据 仓库 管理 中 都 可 以 省 去 。 但 是 ， 
于 数据 仓库 的 查询 数据 量 往往 很 大 ， 所 以 对 数据 查询 提出 了 更 高 的 要 求 ， 需 要 采用 复杂 的 索 
引 技术 。 
4) 数据 是 反映 历史 变化 的 
数据 仓库 中 数据 的 相对 稳定 是 针对 应 用 来 说 的 ， 数 据 仓库 的 用 户 进行 分 析 处 理 时 是 不 进行 
数据 更 新 操作 的 。 但 并 不 表明 在 从 数据 集成 输入 数据 仓库 开始 到 最 终 被 删除 的 整个 数据 生存 后 
期 中 ， 所 有 的 数据 仓库 数据 是 永远 不 变 的 。 数 据 仓 库 的 数据 是 反映 历史 变化 的 ， 这 主要 表现 在 
如 下 三 个 方面 。 
(1) 数据 仓库 随时 间 变 化 不 断 增加 新 的 数据 内 容 。 数 据 仓库 系 统 必须 不 断 捕捉 OLTP 数据 
库 中 变化 的 数据 ， 追 加 到 数据 仓库 中 去 。 
(2) 数据 仓库 随时 间 变 化 不 断 删除 旧 的 数据 内 容 。 
(3) 数据 仓库 中 包含 有 大 量 的 综合 数据 ， 这 些 数据 有 很 多 信息 与 时 间 有 关 ， 如 数据 经 常 
按时 间 段 进行 综合 ， 或 隔 一 定 的 时 间 进 行 抽样 等 等 ， 这 些 数据 要 随时 间 不 断 地 进行 重新 综合 。 


fre 
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2. 数据 仓库 的 数据 模式 


型 的 数据 仓库 具有 为 数据 分 析 而 设计 的 模式 ,使 用 OLAP 工具 进行 联机 分 析 处 理 。 因 此 
数据 通常 是 多 维 数据 ， 包 括 维 属 性 、 度 量 属 性 。 包 含 多 维 数据 的 表 称 为 事实 表 ， 事 实 表 通 常 很 
大 。 例 如 ， 一 个 表 sales 记录 了 零售 商店 的 销售 信息 ， 其 中 每 个 元 组 对 应 一 个 商品 售 出 记录 ,这 
是 一 个 非常 典型 的 事实 表 的 例子 。 表 sales 的 维 包括 售 出 的 是 何 种 商品 (用 商品 标识 表示 )、 商 
品 售 出 的 日 期 、 商 品 售 出 的 地 点 、 哪 个 顾客 购买 该 商品 等 等 。 度 量 属性 包括 售 出 商品 的 数量 和 
金额 。 

为 了 减少 存储 要 求 ， 维 属性 通常 是 一 些 短 的 标识 ， 作 为 参照 其 他 表 的 外 码 。 例 如 ， 事 实 表 
sales 含有 属性 item_key、time_key、branch_key 和 location key， 以 及 度量 属性 units_sold 和 
dollars_sold。 其 中 ， 属 性 item_key 是 一 个 参照 维 表 item 的 外 码 ， 表 item 含有 商品 名 称 、 商 品 
的 品牌 、 商 品 所 属 类 别 等 属性 ， 属 性 time_key 是 一 个 参照 维 表 time 的 外 码 ， 表 time 含有 日 、 
月 、 季 和 年 的 属性 ， 属 性 branch_key 是 一 个 参照 维 表 branch 的 外 码 ， 表 branch 含有 出 售 商品 
的 分 销 商 的 名 称 、 分 销 商 的 类 型 属性 ， 属 性 location_key 是 一 个 参照 维 表 location 的 外 码 ， 表 
location 含有 销售 地 点 的 街道 、 城 市 、 省 份 、 国 家 等 属性 。 由 此 得 到 一 个 事实 表 、 多 维 表 以 及 
从 事实 表 到 多 维 表 的 参照 外 码 的 模式 称 为 星 型 模式 。 如 图 6-24 所 示 。 


item 
time 
time_key A item_key 


item_name 


ay 
day_of the_week brand 


month type 
quarter supplier_type 
year branch_key 

Location key location 
branch unit_sold location_key 


street 

branch _key ly city 

branch name province_or_state 
branch type country 


图 6-24 数据 仓库 的 星 型 模式 示例 


更 复杂 的 数据 仓库 设计 可 能 含有 多 级 维 表 ， 例 如 维 表 item 含有 属性 supplier key， 作 为 参 
照 给 出 供应 商 的 细节 信息 的 另 一 个 维 表 supplier 的 外 码 ; 维 表 city 含有 属性 city_key, 作为 参照 
给 出 城市 的 细节 信息 的 另 一 个 维 表 supplier 的 外 码 。 这 种 模式 称 为 雪花 模式 ， 如 图 6-25 所 示 。 
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图 6-25 数据 仓库 的 雪花 模式 示例 


time item supplier 
time_Kkey A item _key supplier_key 
da item name A supplier_type 
day_of the_wee 4 |brand / 
h type / 
mont supplier key / 
branch key 
Location _key 下 location city 
branch unit_sold location_key oity_ Key 
E / Street Ed re 
bene -Key 4 city_key 『 Pprévince _or_sta 
3 te 
branch _type country 


复杂 的 数据 仓库 设计 可 能 含有 不 止 一 个 事实 表 ， 图 6-26 模式 中 含有 Sales 和 Shipping 两 个 
事实 表 ， 共 享 location、item、time 和 branch 维 表 。 这 种 模式 称 为 事实 星座 模式 。 
1ppln! 


了 


time 
time _key 


ay 
day_of the_we 


© 
month 
quarter 
year 


branch 

branch_ key 
branch_name 
branch _type 


图 6-26 数据 仓库 的 事实 星 型 模式 示例 


3. 数据 仓库 的 体系 结构 


数据 仓库 通常 采用 三 层 体系 结构 ， 底 层 为 数据 仓库 服务 器 、 中 间 层 为 OLAP 服务 器 ， 顶 


为 前 端 工具 。 底 层 的 数据 仓库 服务 器 一 般 是 一 个 关系 数据 库 系统 ， 数 据 仓库 服务 器 从 操作 型 数 
据 库 或 外 部 数据 源 提取 数据 ， 对 数据 进行 清理 、 转 换 、 集 成 等 ， 然 后 装 入 到 数据 仓库 中 。 中 
民 务 器 的 实现 可 以 是 关系 型 OLAP， 即 扩充 的 关系 型 DBMS， 提 供 对 多 维 数据 
持 ; 也 可 以 是 多 维 的 OLAP 服务 器 , 它 是 一 种 特殊 的 服务 器 ,直接 支持 多 维 数据 的 存储 和 操 人 
层 的 前 端 工具 包括 查询 和 报表 工具 、 分 析 工 具 、 数 据 挖掘 工具 等 。 


层 的 OLAP 


顶 


item ~~ftime _key 
item _key 去 三 己 圳 item key 
\ Sales A Ia rshipper _key 
time_key F type from_Location 
item_key 上 | supplier_type ,1 No_Location 
branch_key Fe sr ldollars _cost 
Location key 下 x location Ap | unit_ shipped 
unit_sold WW location_key 1 Shipper 
street Sni 
dollars sold | ty | shipper_Key 
province _or _state \J shipper _name 
country location _key 
shipper_type 


层 


间 


入 


TFT 


从 结构 的 角度 看 有 三 种 数据 仓库 模型 : 企业 仓库 、 数 据 集 市 和 虚拟 仓库 。 


企业 仓库 收集 跨越 整个 企业 的 各 个 主题 的 所 有 信息 。 它 提供 全 企业 范 


围 的 数据 集成 ， 数 据 
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通常 都 来 自 多 个 操作 型 数据 库 和 外 部 信息 提供 者 ， 并 且 是 跨越 多 个 功能 范围 的 。 它 通常 包含 详 
细 数 据 和 汇总 数据 。 企 业 数据 仓库 可 以 在 传统 的 大 型 机 上 实现 ， 例 如 UNIX 超级 服务 器 或 并 行 
结构 平台 。 它 需要 广泛 的 业务 建 模 ， 可 能 需要 多 年 的 时 间 来 设计 和 建造 。 

数据 集 市 包含 对 特定 用 户 有 用 的 、 企 业 范围 数据 的 一 个 子 集 。 它 的 范围 限于 选 定 的 主题 ， 
例如 一 个 商场 的 数据 集 市 可 能 限定 于 它 的 主题 为 顾客 、 商 品 和 销售 。 包 括 在 数据 集 市 中 的 数据 
通常 是 汇总 的 。 通 常 ， 数 据 集 市 可 以 在 低 价格 的 部 门 服务 器 上 实现 ， 基 于 UNIX 或 Windows 
NT/2000/XP。 实 现 数据 集 市 的 周期 一 般 是 数 周 ， 而 不 是 数 月 或 数 年 。 但 是 ， 如 果 它 的 规划 不 是 
企业 范围 的 ， 从 长 远 讲 ， 可 能 会 涉及 很 复杂 的 集成 。 根 据 数据 的 来 源 不 同 ， 数 据 集 市 分 为 独立 
的 和 依赖 的 两 类 。 在 独立 的 数据 集 市 中 , 数据 来 自 一 个 或 多 个 操作 型 数据 库 或 外 部 信息 提供 者 ， 
或 者 是 一 个 特定 部 门 或 地 区 本 地 产生 的 数据 。 在 依赖 数据 集 市 中 , 数据 直接 来 自 企 业 数据 仓库 。 

虚拟 仓库 是 操作 型 数据 库 上 视图 的 集合 。 为 了 有 效 地 处 理 查询 ， 只 有 一 些 可 能 的 汇总 视图 
被 物化 。 虚 拟 仓库 易于 建立 ， 但 需要 操作 型 数据 库 服务 器 具有 剩余 能 力 。 


6.4.2 ”数据 挖掘 


随 着 数据 库 技术 的 不 断 发 展 及 数据 库 管 理 系统 的 广泛 应 用 , 数据 库 中 存储 的 数据 量 急 剧 增 
大 ， 在 大 量 的 数据 背后 隐藏 着 许多 重要 的 信息 ， 如 果 能 把 这 些 信息 从 数据 库 中 抽取 出 来 ， 将 为 
公司 创造 很 多 潜在 的 利润 ， 而 这 种 从 海量 数据 库 中 挖掘 信息 的 技术 ， 就 称 之 为 数据 挖掘 〈Data 
Mining，DMD)。 事 实 上 ， 从 技术 角度 看 ， 数 据 挖掘 可 以 定义 为 从 大 量 的 、 不 完全 的 、 有 噪声 的 、 
模糊 的 、 随 机 的 实际 数据 中 提取 隐 含 在 其 中 的 、 人 们 不 知道 的 、 但 又 潜在 有 用 的 信息 和 知识 的 
过 程 。 


1. 数据 挖掘 的 分 类 


数据 挖 所 工具 能 够 对 将 来 的 趋势 和 行为 进行 预测 ， 从 而 很 好 地 支持 人 们 的 决策 ， 比 如 ， 经 
过 对 公司 整个 数据 库 系 统 的 分 析 ， 数 据 挖掘 工具 可 以 回答 诸如 “哪个 客户 对 我 们 公司 的 邮件 推 
销 活动 最 有 可 能 做 出 反应 ， 为 什么 ”等 类 似 的 问题 。 有 些 数据 挖掘 工具 还 能 够 解决 一 些 很 消耗 
人 工时 间 的 传统 问题 ， 因 为 它们 能 够 快速 地 浏览 整个 数据 库 ， 找 出 一 些 专家 们 不 易 察 觉 的 极 有 
用 的 信息 。 

数据 挖掘 技术 的 分 类 可 以 有 多 种 角度 。 按 照 所 挖掘 数据 库 的 种 类 可 分 为 : 关系 型 数据 库 的 
数据 挖 据 、 数 据 仓库 的 数据 挖掘 、 面 向 对 象 数据 库 的 挖掘、 空间 数据 库 的 挖 据 、 正 文 数据 库 和 
多 媒体 数据 库 的 数据 挖掘 等 。 按 所 发 现 的 知识 类 别 来 分 : 关联 规则 、 特 征 描述 、 分 类 分 析 、 聚 
类 分 析 、 趋 势 和 偏差 分 析 等 。 按 所 发 现 的 知识 抽象 层次 分 类 : 一 般 化 知识 、 初 级 知识 和 多 层次 
知识 等 。 

数据 挖掘 技术 是 人 们 长 期 对 数据 库 技术 进行 研究 和 开发 的 结果 。 起 初 各 种 商业 数据 是 存储 


应 用 中 已 经 可 以 马上 投入 使 用 ， 因 


。 人 工 神经 网 络 : 仿照 生 到 


在 计算 机 的 数据 库 中 的 ， 然 后 发 展 到 可 对 数据 库 进 行 查询 和 访问 ， 进 而 发 展 到 对 数据 库 的 即时 
遍历 。 数 据 挖掘 使 数据 库 技术 进入 了 一 个 更 高 级 的 阶段 ， 它 不 仅 能 对 过 去 的 数据 进行 查询 和 遍 
历 ， 并 且 能 够 找 出 过 去 数据 之 间 的 潜在 联系 ， 从 而 促进 信息 的 传递 。 现 在 数据 挖掘 技术 在 商业 
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为 对 这 种 技术 进行 支持 的 三 种 基础 技术 已 经 发 展 成 熟 。 这 些 技 
术 是 : 海量 数据 搜集 、 强 大 的 多 处 理 器 计算 机 、 数 据 挖掘 算法 。 在 数据 挖掘 中 最 常用 的 技术 如 下 。 


神经 网 络 结构 的 非 线形 预测 模型 ， 通 过 学 习 进行 模式 识别 。 


。 ”决策 树 : 代表 着 决策 集 的 树 形 结构 。 
。 ”遗传 算法 : 基于 进化 理论 ， 并 采用 遗传 结合 、 遗 传 变异 ， 以 及 自然 选择 等 设计 方法 的 


优化 技术 。 


。 近邻 算法 : 将 数据 集合 中 每 一 个 记录 进行 分 类 的 方法 。 

。 ”规则 推导 :从 统计 意义 上 对 数据 中 的 “如 果 - 那 么 ”规则 进行 寻找 和 推导 。 

采用 上 述 技术 的 某 些 专门 的 分 析 工具 已 经 发 展 了 大 约 十 年 的 时 间 , 不 过 这 些 工具 所 面 对 的 
数据 量 通常 较 小 。 而 现在 这 些 技术 已 经 被 直接 集成 到 许多 大 型 的 工业 标准 的 数据 仓库 和 联机 分 
析 系 统 中 去 了 。 将 数据 挖掘 工具 与 传统 数据 分 析 工 具 的 进行 比较 〈 如 表 6-4 所 示 )， 可 以 发 现 传 
统 数据 分 析 工 具 的 分 析 重 点 在 于 向 管理 人 员 提 供 过 去 已 经 发 生 什 么 ， 描 述 过 去 的 事实 ， 例 如 ， 


上 个 月 的 销售 成 本 是 多 少 ; 而 挖掘 工具 则 在 于 预测 未 来 的 情况 , 解释 过 去 所 发 生 的 事实 的 原因 ， 
例如 ， 下 个 月 的 市 场 需求 情况 怎样 , 或 者 某 个 客户 为 什么 会 转向 竞争 对 手 。 分 析 的 目的 也 不 同 ， 


前 者 是 为 了 从 过 去 的 事实 中 列 出 管理 人 员 感 兴趣 的 事实 ， 例如， 哪些 是 公司 最 大 的 客户 ;后 者 
则 是 要 找 出 未 来 可 能 称 为 公司 最 大 的 客户 。 从 两 者 分 析 是 所 需 的 数据 量 来 看 , 也 有 明显 的 差异 ， 
前 者 需要 的 数据 量 并 不 很 大 ， 而 后 者 需要 海量 数据 才能 运行 。 


表 6-4 数据 挖掘 工具 与 传统 数据 分 析 工 具 的 比较 


比较 内 容 | 传统 数据 分 析 工 具 〈DSS/EIS) 数据 挖掘 工具 
工具 特点 回顾 型 的 、 验 证 型 的 预测 型 的 、 发 现 型 的 


分 析 重 点 已 发 生 了 什么 


预测 未 来 的 情况 、 解 释 发 生 的 原 


分 析 目 的 | 从 最 近 的 销售 中 列 出 最 大 客户 锁定 未 来 的 可 能 客户 、 减 少 未 来 的 销售 成 本 


数据 集 大 小 


启动 方式 


数据 维 、 维 中 属性 数 、 维 中 数据 均 
是 少量 的 
企业 管理 人 员 、 系 统 分 析 员 、 管 理 
顾问 启动 与 控制 


数据 维 、 维 中 属性 数 、 维 中 数据 均 是 庞大 的 


数据 与 系统 启动 、 少 量 的 人 员 指导 


技术 情况 | 成 熟 


2. 数据 挖掘 与 数据 仓库 的 关系 


根据 数据 挖掘 的 定义 可 以 看 


H 


by 


统计 分 析 工具 已 经 成 熟 其 他 工具 正在 发 展 中 


数据 挖掘 包含 一 系列 则 在 数据 库 中 发 现 有 用 而 未 发 现 的 模 
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式 的 技术 ， 如 果 将 其 与 数据 仓库 紧密 联系 在 一 起 ， 将 会 获取 意外 的 成 功 。 传 统 的 观点 认为 ， 数 
据 挖掘 技术 扎根 于 计算 科学 和 数学 ， 不 需要 也 不 得 益 于 数据 仓库 。 这 种 观点 并 不 正确 ， 成 功 的 
数据 挖掘 的 关键 之 一 在 于 通过 访问 正确 、 完 整 和 集成 的 数据 ， 才 能 进行 深层 次 的 分 析 ， 寻 求 有 
益 的 信息 。 而 这 些 正 是 数据 仓库 所 能 提供 的 ， 数 据 仓库 不 仅 是 集成 数据 的 一 种 方式 ， 而 数据 仓 
库 的 联机 分 析 功 能 OLAP 还 为 数据 挖掘 提供 了 一 个 极 佳 的 操作 平台 。 如 果 数 据 仓库 与 数据 挖掘 
E 够 实现 有 效 的 联结 ， 将 给 数据 挖掘 带 来 各 种 便利 和 功能 。 


3. 数据 挖掘 技术 的 应 用 过 程 


数据 挖掘 过 程 一 般 需 要 经 历 确 定 挖掘 对 象 、 准 备 数据 、 建 立 模型 、 数 据 挖 握 、 结 果 分 析 与 
知识 应 用 这 样 几 个 阶段 。 

1) 确定 挖掘 对 象 

数据 挖掘 的 第 一 步 是 要 定义 清晰 的 挖掘 对 象 、 认 清 数据 挖掘 的 目标 。 数 据 挖掘 的 最 后 结果 
往往 是 不 可 预测 的 ， 但 是 探索 的 问题 应 是 有 预见 性 的 、 有 目标 的 。 为 了 数据 挖掘 而 挖掘 数据 带 
有 盲目 性 ， 往 往 是 不 会 成 功 的 。 在 定义 挖掘 对 象 时 ， 需 要 确定 这 样 的 问题 : 从 何 处 入 手 ? 需要 
挖掘 什么 数据 ? 要 用 多 少数 据 ? 数据 挖掘 要 进行 到 什么 程度 ? 虽然 在 数据 挖掘 中 常常 事先 不 
能 确定 最 后 挖掘 的 结果 到 底 是 什么 ? 例如 ， 选 择 的 数据 是 描述 信用 卡 客户 的 实际 支付 情况 ， 那 
么 数据 挖掘 者 的 工作 就 可 能 是 围绕 着 获取 信用 卡 使 用 者 实际 支付 情况 而 展开 的 。 

有 时 还 要 用 户 提供 一 些 先 验 的 知识 ， 例 如 概念 树 等 。 这 些 先 验 知识 可 能 是 用 户 业务 领域 知 
识 或 以 前 数据 挖掘 所 获得 的 初步 成 果 。 这 就 意味 着 数据 挖掘 是 一 个 过 程 ， 在 挖掘 过 程 中 可 能 提 
出 新 的 问题 ， 可 能 尝试 用 其 他 方法 来 检验 数据 ， 在 数据 的 子 集 上 进行 同样 的 研究 。 有 时 业务 对 
象 是 一 些 已 经 理解 的 数据 ， 但 是 在 某 些 情况 下 还 需要 对 这 些 数据 进行 挖掘 。 此 时 ， 不 是 通过 数 
据 挖掘 发 现 新 的 有 价值 的 信息 ， 而 是 通过 数据 挖掘 验证 假设 的 正确 性 ， 或 者 是 通过 同样 方式 的 
数据 挖掘 查看 模式 是 否 发 生变 化 。 如 果 在 经 常 性 的 同样 的 数据 挖掘 中 的 一 次 挖掘 没有 出 现 以 前 
同样 的 结果 ， 这 意味 着 模式 已 经 发 生 了 变化 ， 可 能 需要 进行 更 深层 次 的 挖掘 。 例 如 ， 将 数据 挖 
握 应 用 于 客户 关系 管理 (CRM) 中， 就 需要 对 客户 关系 管理 的 商业 主题 进行 仔细 的 定义 。 每 个 
CRM 应 用 都 有 一 个 或 多 个 商业 目标 ， 要 为 每 个 目标 建立 恰当 的 模型 。 例 如 ,“ 提 高 客户 对 企业 
促销 的 响应 率 ” 和 “提高 每 个 客户 的 响应 价值 ”这 两 个 目标 是 不 同 的 ， 并 且 在 定义 问题 的 同时 
也 生成 了 评价 CRM 应 用 结果 的 标准 和 方法 ， 即 确定 了 数据 挖掘 的 评价 指标 。 

2) 准备 数据 
在 确定 数据 挖掘 的 业务 对 象 后 ， 需 要 搜索 所 有 与 业务 对 象 有 关 的 内 部 和 外 部 数据 ， 从 中 选 
出 适合 于 数据 挖掘 应 用 的 数据 。 对 数据 的 选择 必须 在 建立 数据 挖掘 模型 之 前 完成 。 选 择 数据 后 ， 
还 需要 对 数据 进行 预 处 理 ， 对 数据 进行 清洗 、 解 决 数据 中 的 缺 值 、 元 余 、 数 据 值 的 不 一 致 性 、 
数据 定义 的 不 一 致 性 、 过 时 数据 等 问题 。 在 数据 挖掘 时 ， 有 时 还 需要 将 数据 分 组 ， 以 提高 数据 
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挖掘 的 效率 ， 降 低 模型 的 复杂 度 。 

3) 建立 模型 

将 数据 转换 成 一 个 分 析 模 型 ， 这 个 分 析 模 型 是 针对 挖掘 算法 建立 的 。 建 立 一 个 真正 适合 挖 
掘 算法 的 分 析 模 型 ， 是 数据 挖掘 的 关键 。 

4) 数据 挖掘 

对 所 得 到 的 经 过 转化 的 数据 进行 挖掘 ， 除 了 完善 与 选择 合适 的 算法 需要 人 工 干预 外 ， 数 据 
挖掘 工作 都 由 数据 挖掘 工具 自动 完成 。 

5) 结果 分 析 

当 数 据 挖 掘 出 现 结果 后 ， 要 对 挖掘 结果 进行 解释 和 评估 。 具 体 的 解释 和 评估 方法 一 般 根据 
数据 挖掘 操作 结果 所 制定 的 决策 成 败 来 定 ， 但 是 管理 决策 分 析 人 员 在 使 用 数据 挖掘 结果 之 前 ， 
又 希望 能 够 对 挖掘 的 结果 进行 评估 ， 以 保证 数据 挖掘 结果 在 实际 应 用 中 的 成 功率 。 因 此 ， 在 对 
数据 挖掘 结果 进行 评价 时 ， 可 以 考虑 这 样 几 个 方面 的 问题 : 第 一 ， 建 立 模型 相同 的 数据 集 在 模 
型 上 进行 操作 所 获得 的 结果 要 优 于 用 不 同 数据 集 在 模型 上 的 操作 结果 ; 第 二 ， 模 型 的 某 些 结果 
可 能 比 其 他 预测 结果 更 加 准确 ;第 三 ， 由 于 模型 是 以 样板 数据 为 基础 建立 的 ， 因 此 ， 实 际 结果 
往往 会 比 建 模 时 的 结果 差 。 另 外 ， 利 用 可 视 化 技术 可 将 数据 挖 据 结 果 表 现 得 更 清楚 ， 更 有 利于 
对 数据 挖掘 结果 的 分 析 。 

(6) 知识 应 用 

数据 挖掘 的 结果 经 过 业务 决策 人 员 的 认可 ， 才 能 实际 利用 。 要 将 通过 数据 挖掘 得 出 的 预测 
模式 和 各 个 领域 的 专家 知识 结合 在 一 起 ， 构 成 一 个 可 供 不 同类 型 的 人 使 用 的 应 用 程序 。 也 只 有 
通过 对 挖掘 知识 的 应 用 ， 才 能 对 数据 挖掘 的 成 果 做 出 正确 地 评价 。 但 是 ， 在 应 用 数据 挖掘 的 成 
果 时 ， 决 策 人 员 关 心 的 是 数据 挖掘 的 最 终结 果 与 用 其 他 候选 结果 在 实际 应 用 中 的 差距 。 

数据 挖掘 技术 可 以 让 现 有 的 软件 和 硬件 更 加 自动 化 ， 并 且 可 以 在 升级 的 或 者 新 开发 的 平台 
上 执行 。 当 数据 挖掘 工具 运行 于 高 性 能 的 并 行 处 理 系 统 上 的 时 候 ， 它 能 在 数 分 钟 内 分 析 一 个 超 
大 型 的 数据 库 。 这 种 更 快 的 处 理 速 度 意味 着 用 户 有 更 多 的 机 会 来 分 析 数 据 ， 让 分 析 的 结果 更 加 
准确 可 靠 , 并 且 易 于 理解 。 数据库 可 以 由 此 拓展 深度 和 广度 。 在 深度 上 ， 人 允许 有 更 多 的 列 存在 。 
以 往 ， 在 进行 较 复杂 的 数据 分 析 时 ， 专 家 们 限于 时 间 因 素 ， 不 得 不 对 参加 运算 的 变量 、 数 量 加 
以 限制 ,但 是 那些 被 丢弃 而 没有 参加 运算 的 变量 有 可 能 包含 着 另 一 些 不 为 人 知 的 有 用 信息 。 现 
在 ， 高 性 能 的 数据 挖掘 工具 让 用 户 对 数据 库 能 进行 通盘 的 深度 编 历 ， 并 且 任 何 可 能 参 选 的 变量 
都 被 考虑 进去 ， 再 不 需要 选择 变量 的 子 集 来 进行 运算 了 。 广 度 上 ， 人 允许 有 更 多 的 行 存 在 。 更 大 
的 样本 使 产生 错误 和 变化 的 概率 降低 ， 这 样 用 户 就 能 更 加 精确 地 推导 出 一 些 虽 小 但 颇 为 重要 的 
结论 。 
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关系 数据 库 具有 坚实 的 理论 基础 ， 这 一 理论 有 助 于 关系 数据 库 的 设计 和 用 户 对 数据 库 信息 
需求 的 有 效 处 理 。 它 涉及 的 内 容 有 : 关系 模型 的 基本 知识 、 关 系数 据 库 的 标准 语言 SQL、 查 询 
优化 以 及 关系 数据 理论 。 本 章 研究 的 是 关系 数据 库 包 括 : 关系 模型 的 数据 结构 、 关 系 的 操作 和 
关系 的 完整 性 。 


7.1 关系 数据 库 概述 


建立 数据 库 系统 的 主要 目的 是 为 了 数据 库 中 信息 的 共享 ， 关 系数 据 库 是 目前 应 用 的 非常 / 
泛 的 数据 库 之 一 ， 是 有 一 套 完整 的 理论 做 支持 的 。 关 系 模型 是 关系 数据 库 的 基础 ， 由 关系 数据 
结构 、 关 系 操作 集合 和 关系 完整 性 规则 三 部 分 组 成 。 本 章 介绍 关系 模型 的 基本 概念 、 关 系 代数 
和 关系 演算 、 标 准 语言 SQL、 查询 处 理 策略 和 查询 优化 以 及 关系 数据 库 设计 理论 方面 的 内 容 。 


7.1.1 基础 知识 


1. 关系 数据 库 系统 


关系 数据 库 系 统 是 支持 关系 数据 模型 的 数据 库 系统 。 

关系 数据 库 应 用 数学 方法 来 处 理 数据 库 中 的 数据 。 最 早 提 出 将 这 类 方法 用 于 数据 处 理 的 是 
1962 年 CODASYL 发 表 的 “信息 代数 ”一 文 ， 之 后 有 1968 年 David Child 在 7090 机 上 实现 的 
集合 论 数据 结构 ， 但 系统 而 严格 地 提出 关系 模型 的 是 美国 IBM 公司 的 E.F.Codd。 

1970 年 E.F.Codd 在 美国 计算 机 学 会 会 刊 Communication of the ACM 上 发 表 的 题 为 “A 
Relational Model of Data for Shared Data Banks” 的 论文 ， 开 创 了 数据 库 系统 的 新 纪元 。 以 后 ， 
他 连续 发 表 了 多 篇 论文 ， 黄 定 了 关系 数据 库 的 理论 基础 。 

20 世纪 70 年 代 末 ， 关 系 方法 的 理论 研究 和 软件 系统 的 研制 均 取得 了 很 大 成 果 ，IBM 公司 
的 San Jose 实验 室 在 IBM370 系列 机 上 研制 的 关系 数据 库 实验 系统 System R 获得 成 功 。1981 
年 IBM 公司 又 宣布 了 具有 System R 全 部 特征 的 新 的 数据 库 软件 产品 SQL/DS 问世 .与 System R 
同期 ， 美 国 加 州 大 学 柏 克利 分 校 也 研制 厂 mgres 关系 数据 库 实 验 系统 ， 并 由 Inges 公司 发 展 成 
为 mgres 数据 库 产 品 。 

几 十 年 来 ， 关 系数 据 库 系统 的 研究 取得 了 辉煌 的 成 就 。 关 系 方法 从 实验 室 走 向 了 社会 ， 涌 
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现 出 许多 性 能 良好 的 商品 化 关系 数据 库 管理 系统 (RDBMS)。 如 著名 的 IBM DB2, Oracle, Ingres， 
SYBASE，Informix 等 。 数 据 库 的 应 用 领域 迅速 扩大 。 


2. 关系 的 相关 名 词 


(1) 属性 (Attribute): 在 现实 世界 中 ， 要 描述 一 个 事物 常常 取 若 干 特征 来 表示 。 这 些 特 征 
称 为 属性 。 例 如 学 生 用 学 号 、 姓 名 、 性 别 、 系 别 、 年 龄 、 籍 贯 等 属性 来 描述 。 

(2) 域 (Domain): 每 个 属性 的 取 值 范围 所 对 应 一 个 值 的 集合 ， 称 为 该 属性 的 域 。 例 如 ， 
学 号 的 域 是 6 位 整 型 数 ， 姓 名 的 域 是 10 位 字符 ， 性 别 的 域 为 { 男 ， 女 }; …… 一 般 在 关系 数据 
模型 中 ， 对 域 还 加 了 一 个 限制 ， 所 有 的 域 都 应 是 原子 数据 (Atomic Data)。 例 如 ， 整 数 、 字 符 
串 是 原子 数据 , 而 集合 、 记录 、 数 组 是 非 原子 数据 ,关系 数据 模型 的 这 种 限制 称 为 第 一 范式 (First 
Normal Form，1NF) 条 件 。 但 也 有 些 关系 数据 模型 突破 了 1NF 的 限制 ， 称 为 非 INF 的 。 

(3) 目 或 度 (Degree): 这 里 的 RR 表示 关系 的 名 字 ，n 是 关系 的 目 或 度 。 

(4) 候选 码 〈Candidate Key): 若 关系 中 的 某 一 属性 或 属性 组 的 值 能 唯一 的 标识 一 个 元 组 ， 
则 称 该 属性 或 属性 组 为 候选 码 。 

(5) 主 码 (Primary Key): 或 称 为 主键 ， 若 一 个 关系 有 多 个 候选 码 ， 则 选 定 其 中 一 个 为 主 码 。 

(6) 主 属性 (Prime Attribute): 包含 在 任何 候选 码 中 的 诸 属性 称 为 主 属 性 。 不 包含 在 任何 
候选 码 中 的 属性 称 为 非 主 属性 (NonPrime Attribute ) 。 

(7) 外 码 (Foreign Key): 如 果 关 系 模式 R 中 的 属性 或 属性 组 非 该 关系 的 码 ， 但 它 是 其 他 
关系 的 码 ， 那 么 该 属性 集 对 关系 模式 R 而 言 是 外 码 。 

例如 ， 客 户 与 贷款 之 间 的 借贷 联系 c-1 (c-idloan-no) ， 属 性 c-id 是 客户 关系 中 的 码 ， 所 
以 c-id 是 外 码 ， 属 性 loan-no 是 贷款 关系 中 的 码 ， 所 以 loan-no 也 是 外 码 。 

(8) 全 码 (All-key): 关系 模型 的 所 有 属性 组 是 这 个 关系 模式 的 候选 码 ， 称 为 全 码 。 

例如 ， 关 系 模式 R(T，C，S)， 属 性 T 表示 教师 ， 属 性 C 表示 课程 ， 属 性 S 表示 学 生 。 
假设 一 个 教师 可 以 讲授 多 门 课程 ， 某 门 课程 可 以 由 多 个 教师 讲授 ， 学 生 可 以 听 不 同 教师 讲授 的 
不 同 课程 ， 那 么 ， 要 想 区 分 关系 中 的 每 一 个 元 组 ， 这 个 关系 模式 R 的 码 应 为 全 属性 T、C 和 5， 
即 All-key。 


3， 笛 卡 儿 积 与 关系 


【定义 7.1)】 设 Di,D,,D;,…,DD, 为 任意 集合 ， 定 义 Di,D,,D;,…,DD, 的 笛 卡 儿 积 为 : 
Di xD, xD;, x:…xD, ={(di,d,,ds,…,d, )d; € D;, i=1,2,3,…,n} 
其 中 集合 中 的 每 一 个 元 素 (qd1,d,,d;,…,d, ) 叫做 一 个 元 组 (n- tuple， 即 n 个 属性 的 元 组 )， 
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元 素 中 的 每 一 个 值 d; 叫做 元 组 一 个 分 量 。 若 D;(i =1,2,3,…,n) 为 有 限 集 ， 其 基数 〈Cardinal 
Number， 元 组 的 个 数 ) 为 m(i=12,3…,n)， 则 DX D, XD,…X D, 的 基数 M 为 ， M= 直 mr 。 
i=] 


注意 ; 笛 卡 儿 积 可 以 用 二 维 表 来 表示 。 

【 例 7.1】 若 DD = 人 ,十 ，D ={a,5}，D; ={c,a}, 求解 DXD, XD 以 及 DXD, xD， 
的 基数 。 
铎 ， 根据 定义 7.1 可 知 D, X D, X D; 中 的 每 一 个 元 素 是 一 个 三 元 组 ， 其 结果 为 : 
Di XD, XD,={(0,a,c),(0,a,d),(0,b,c),(0,b,4d),(l,a,c),(1,a,4),(1,b,c),(1,5,4)} 
于 Di 的 基数 四 =2、D, 的 基数 m, =2、D; 的 基数 ma =2， 所 以 DX D, XD 的 基数 
M==m Xm, Xm = 二 2X2X2=6。 可 以 用 二 维 表 来 表示 D, X D, X D;， 如 图 7-1 所 示 。 


图 7-1 Di xD,xD; 笛 卡 儿 积 的 二 维 表 表示 


【定义 7.2] XD XD…XD 的 子 集 叫做 在 域 甩 DD…D 上 的 关系 , 记 为 RCD,D,D,…D,)， 
称 关系 尺 为 n 元 关系 。 

定义 7.2 可 以 得 出 一 个 关系 也 可 以 用 二 维 表 来 表示 。 关 系 中 属性 的 个 数 称 为 “元 数 ”， 元 
组 的 个 数 称 为 “基数 ”。 关 系 模型 中 的 术语 与 一 般 术语 的 对 应 情况 可 以 通过 图 7-2 中 的 学 生 关 


系 说 明 。 
-关系 模 型 术语 _ 一 般 术 语 _ 
二 二 人 属性 4 一 | 属性 字段 、 数 据 项 
[so [snarhe | SD |sex je 一 关系 模式 记录 类 型 
通信 元 组 1 记录 1 
通信 元 组 2 记录 2 
通信 元 组 3 记录 3 


元 组 4 记录 4 
元 组 5 记录 5 
元 组 6 记录 6 


电子 工 


图 7-2 学 生 关系 与 术语 的 对 应 情况 
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图 7-2 中 属性 S no、Sname、SD 和 Sex 分 别 表 示 学 号 、 姓 名 、 所 在 院 系 、 性 别 。 该 学 生 关 
系 模式 可 表示 为 : 学 生 (S_no,Sname,SD,Sex); 属性 S_no 加 下 画 线 表 示 该 属性 为 主 码 ; 属性 Sex 
的 域 为 男 、 女 ， 等 等 。 从 图 7-2 中 不 难看 出 ， 该 学 生 关 系 的 元 数 为 4， 基数 为 6。 


4. 关系 的 三 种 类 型 
(1) 基本 关系 (通常 又 称 为 基本 表 或 基 表 )。 它 是 实际 存在 的 表 ， 是 实际 存储 数据 的 逻辑 


表示 。 
(2) 查询 表 。 查 询 结 果 对 应 的 表 。 

(3) 视图 表 。 是 由 基本 表 或 其 他 视图 表 导 出 的 表 。 由 于 它 本 身 不 独立 存储 在 数据 库 中 ， 数 
据 库 中 只 存放 它 的 定义 ， 所 以 常 称 为 虚 表 。 


7.1.2 关系 数据 库 模 式 


在 数据 库 中 要 区 分 型 和 值 。 关系 数据 库 中 的 型 也 称 为 关系 数据 库 模 式 , 是 关系 数据 库 结构 的 
描述 。 它 包括 若干 域 的 定义 以 及 在 这 些 域 上 定义 的 若干 关系 模式 。 实 际 上 ， 关 系 的 概念 对 应 于 程 
序 设计 语言 中 变量 的 概念 ， 而 关系 模式 对 应 于 程序 设计 语言 中 类 型 定义 的 概念 。 关 系数 据 库 的 值 
是 这 些 关 系 模式 在 某 一 时 刻 对 应 的 关系 的 集合 ， 通 常 称 之 为 关系 数据 库 。 

【定义 7.3】 关系 的 描述 称 为 关系 模式 (Relation Schema)。 可 以 形式 化 地 表示 为 : 

R(U,D,dom,F) 

其 中 ，R 表示 关系 名 ; U 是 组 成 该 关系 的 属性 名 集合 ; D 是 属性 的 域 ，dom 是 属性 向 域 的 
映像 集合 ; 为 属性 间 数 据 的 依赖 关系 集合 。 

通常 将 关系 模式 简 记 为 : 


R(U) 或 R(A1, 42 A3,…, A,) 

其 中 ，R 为 关系 名 ，4 42, 43,…, 4 为 属性 名 或 域名 ， 属 性 向 域 的 映像 常常 直接 说 明 属性 
的 类 型 、 长 度 。 通 常 在 关系 模式 主 属性 上 加 下 夯 线 表示 该 属性 为 主 码 属性 。 

例如 : 学 生 关 系 5 有 学 号 Sno、 学 生 姓 名 Same、 系 名 SD、 年 龄 SA 属性 :课程 关系 C 有 
课程 号 Cno、 课 程 名 Cname、 先 修 课 程 号 PCno 属性 ;学 生 选 课 关 系 SC 有 学 号 Sno、 课 程 号 
Cno、 成 绩 Grade 属性 。 定 义 关 系 模式 及 主 码 如 下 本题 未 考虑 FF 属性 间 数 据 的 依赖 ， 该 问题 
在 后 续 内 容 讨 论 )。 

(1) 学 生 关系 模式 S(Sno,Sname,SD,SA)。 

(2) 课程 关系 模式 C(Cno,Cname,PCno)，Dom(PCno)=Cno。 这 里 ，Pcno 是 先行 课程 号 ,来 
自 Cno 域 , 但 由 于 Pcno 属性 名 不 等 于 Cno 值 域名 ,所 以 要 用 Dom 来 定义 。 但是, 不 能 将 Pcno 
直接 改 为 Cno， 因 为 在 关系 模型 中 ， 各 列 属性 必须 取 相 异 的 名 字 。 

(3) 学 生 选 课 关 系 模式 SC(Sno,Cno,Grade)。SC 关系 中 的 Sno、Cno 又 分 别 为 外 码 。 因 为 
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它们 分 别 是 S、C 关系 中 的 主 码 。 
7.1.3 ”关系 的 完整 性 约束 


完整 性 规则 提供 了 一 种 手段 来 保证 当 授权 用 户 对 数据 库 作 修改 时 不 会 破坏 数据 的 一 致 性 。 
因此 ， 完 整 性 规则 防止 的 是 对 数据 的 意外 破坏 。 关 系 模型 的 完整 性 规则 是 对 关系 的 某 种 约束 条 
件 。 例 如 ， 若 某 企 业 实验 室 管理 员 的 基本 薪资 小 于 2000 元 ， 则 可 用 完整 性 规则 来 进行 约束 。 

关系 的 完整 性 约束 共 分 为 三 类 : 实体 完整 性 、 参 照 完整 性 〈 也 称 引用 完整 性 ) 和 用 户 定义 
完整 性 。 

(1) 实体 完整 性 〈Entity Integrity)。 规 定 基本 关系 R 的 主 属性 4 不 能 取 空 值 。 

(2) 参照 完整 性 (Referential Integrity)。 现 实 世 界 中 的 实体 之 间 往 往 存在 某 种 联系 ， 在 关 
系 模型 中 实体 及 实体 间 的 联系 是 用 关系 来 描述 的 ， 这 样 自然 就 存在 着 关系 与 关系 间 的 引用 。 

参照 完整 性 规定 : 若 F 是 基本 关系 R 的 外 码 ， 它 与 基本 关系 8 的 主 码 K, 相 对 应 (基本 关 
系 R 和 5S 不 一 定 是 不 同 的 关系 )， 则 对 于 R 中 每 个 元 组 在 上 的 值 或 者 取 空 值 (F 的 每 个 属性 
值 均 为 空 值 )， 或 者 等 于 5 中 某 个 元 组 的 主 码 值 。 

例如 ， 某 企业 员工 Emp 关系 模式 和 部 门 Dept 关系 模式 表示 如 下 : 

Emp《〈 员 工 号 ， 姓 名 ， 性 别 ， 参 加 工作 时 间 ， 部 门 号 ) 

Dept〈 部 门 号 ， 名 称 ， 电 话 ， 负 责 人 ) 

Emp 和 Dept 关系 存在 着 属性 的 引用 ， 即 员工 关系 中 的 “部 门 号 ” 值 必须 是 确实 存在 的 部 
门 的 部 门 号 。 按照 关系 的 完整 性 规则 , 员工 关系 中 的 “部 门 号 ”属性 取 值 要 参照 部 门 关系 的 “部 
门 号 ”属性 取 值 。 如 果 新 入 职 的 员工 还 未 分 配 具 体 的 部 门 ， 那 么 部 门 号 取 空 值 。 

注意 : 如 果 在 关系 模式 主 属性 上 加 实 下 画 线 ， 通 常 表示 该 属性 为 主 码 属性 ， 如果 在 关系 模 
式 属性 上 加 虚 下 画 线 ， 通 常 表示 该 属性 为 外 码 属性 。 

(3) 用 户 定义 完整 性 (User defined Integrity)。 就 是 针对 某 一 具体 的 关系 数据 库 的 约束 条 件 ， 
反映 某 一 具体 应 用 所 涉及 的 数据 必须 满足 的 语义 要 求 ， 由 应 用 的 环境 决定 。 例 如 ， 银 行 的 用 户 
账户 规定 必须 大 于 等 于 100 000， 小 于 999 999。 


7.2 关系 运算 


关系 操作 的 特点 是 操作 对 象 和 操作 结果 都 是 集合 。 而 非 关 系数 据 模型 的 数据 操作 方式 则 为 
一 次 一 个 记录 的 方式 。 关 系数 据 语言 分 为 三 类 : 关系 代数 语言 、 关 系 演算 语言 和 具有 关系 代数 
和 关系 演算 双重 特点 的 语言 (如 SQL)。 关系 演算 语言 包含 元 组 关系 演算 语言 (如 Aplha, Quel) 
和 域 关 系 演算 语言 (如 QBE)。 

关系 代数 语言 、 元 组 关系 演算 和 域 关系 演算 是 抽象 查询 语言 ， 它 与 具体 的 DBMS 中 实现 
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的 实际 语言 并 不 一 样 ， 但 是 可 以 用 它 评 估 实际 系统 中 的 查询 语言 能 力 的 标准 。 
7.2.1 关系 代数 运算 


关系 代数 运算 符 有 4 类 : 集合 运算 符 、 专 门 的 关系 运算 符 、 算 术 比 较 符 和 风 辑 运算 符 。 根 
据 运 算 符 的 不 同 ， 关 系 代数 运算 可 分 为 传统 的 集合 运算 和 专门 的 关系 运算 。 传 统 的 集合 运算 是 
从 关系 的 水 平方 向 进行 的 ， 包 括 并 、 交 、 差 及 广义 笛 卡 儿 积 。 专 门 的 关系 运算 既 可 以 从 关系 的 
水 平方 向 进行 运算 ， 又 可 以 向 关系 的 垂直 方向 运算 ， 包 括 选择 、 投 影 、 连 接 以 及 除法 ， 如 表 7-1 
所 示 。 


表 7-1 关系 代数 运算 符 


运算 符 
> 
U 过 
集合 运算 符 | . 
= 
尖 
Oo 
专门 的 关系 运 和 
算 符 pa 


7.2.2 五 种 基本 的 关系 代数 运算 


五 种 基本 的 关系 代数 运算 包括 并 、 差 、 笛 卡 儿 积 、 投 影 和 选择 ， 其 他 运算 可 以 通过 基 
本 的 关系 运算 导出 。 
1. 并 (Union) 


关系 RR 与 5 具有 相同 的 关系 模式 ， 即 R 与 5 的 元 数 相同 (结构 相同 )。 关 系 与 S$ 并 由 属 
于 或 属于 5 的 元 组 构成 的 集合 组 成 ， 记 作 RUS， 其 形式 定义 如 下 : 
RUS={tlteRvtesS} 


式 中 1 为 元 组 变量 。 


2. 差 (Difference) 


关系 与 S$ 具 有 相同 的 关系 模式 ， 关 系 与 S 的 差 是 由 属于 RR 但 不 属于 5 的 元 组 构成 的 
集合 ， 记 作 RR-S ， 其 形式 定义 如 下 : 
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R-S={tlteRrtes} 
3. 广义 笛 卡 儿 积 (Extended Cartesian Product) 


两 个 元 数 分 别 为 n 目 和 m 目的 关系 RR 和 5 的 广义 销 卡 儿 积 是 一 个 (ntm) 列 的 元 组 的 集合 。 
元 组 的 前 n 列 是 关系 R 的 一 个 元 组 ， 后 m 列 是 关系 S 的 一 个 元 组 ， 记 作 RXS ， 其 形式 定义 
如 下 : 
RXS={t|t=<7",t" >At" eRAt” ES 
如 果 RR 和 5S 中 有 相同 的 属性 名 , 可 在 属性 名 前 加 关系 名 作为 限定 , 以 示 区 别 。 若 R 有 KK 个 
元 组 ，S 有 KK, 个 元 组 ， 则 R 和 5 的 广义 笛 卡 儿 积 有 天 XK, 个 元 组 。 
注意 : 本 教材 中 的 <r",t”> 意 为 元 组 如 和 妃 拼 接 成 的 一 个 元 组 。 


4. 投影 (Projection) 


投影 运算 是 从 关系 的 垂直 方向 进行 运算 ， 在 关系 R 中 选择 出 若干 属性 列 4 组 成 新 的 关系 ， 
记 作 r4(R) ， 其 形式 定义 如 下 : 


Ta(R)= {Al|te R} 
5， 选择 (Selection) 


选择 运算 是 从 关系 的 水 平方 向 进行 运算 ,是 从 关系 R 中 选择 满足 给 定 条 件 的 诸 元 组 ， 记 作 
op(R)， 其 形式 定义 如 下 : 


op(R)={tlte RAF()= True} 

其 中 ,，F 中 的 运算 对 象 是 属性 名 (或 列 的 序号 ) 或 常数 ， 运 算 符 、 算 术 比 较 符 (<、 夺 、 
>、 三 、z# ) 和 届 辑 运算 符 (和 人 、v 、 一 )。 例 如 ，ai>s(R) 表 示 选 取 尺 关系 中 第 1 个 属性 值 大 
于 等 于 第 6 个 属性 值 的 元 组 ;mi>6'(R) 表示 选取 RR 关系 中 第 1 个 属性 值 大 于 6 的 元 组 。 

【 例 7.2】 设 有 关系 R、8 如 图 7-3 所 示 , 请 求 出 RUS ，R-S ，RXS ，rdc(R) ，ad>s(R) 


和 os<4(RXS) 。 
AEcdlD 
b a 
d|r 
让 二 
(b) 关系 5 


图 7-3 关系 R、3 
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解 ，RUS，R-S，RXS ，z4c(R)，o4sg(R) 和 os(RXS) 的 结果 如 图 7-4 所 示 。 其 


中 ，RXS 生成 的 关系 属性 名 有 重复 ， 按 照 关系 “属性 不 能 重 名 ”的 性 质 ， 


通常 采用 “关系 名 . 


后 “选取 R.C 值 小 于 S.A 值 ”的 元 组 。 


属性 名 ”的 格式 。 对 于 os(RX5S) 的 含义 是 RXS 后 “选取 第 3 个 属性 值 小 于 第 4 个 属性 值 ” 
的 元 组 .由 于 RXS 的 第 3 个 属性 为 R.C, 第 4 个 属性 是 S.A, 因此 o.4(RX5) 的 含义 也 是 RXS 


RUS RxS 
A 
站 b R.A R.B R.C S.A S.B S.C 
b 站 a b c b a d 
d a b c d f g 
f a b c f h k 
f h b a d b a d 
二 b a d d f g 
六 B b a d f h k 
c d e b a d 
a b c 
网 d c d e d f 3 
c d e 攻 h k 
TAC(R) d f g b a d 
A C d f g d f g 
a c d f g f h k 
b d 
ec e 
d 里 
A 
b 


图 7-4 运算 结果 


7.2.3 扩展 的 关系 运算 


扩展 的 关系 运算 可 以 从 基本 的 关系 运算 中 导出 。 主 要 包括 : 选择 、 投 影 、 连 接 、 除 法 、 广 


义 笛 卡 儿 积 、 外 联接 。 


1. 交 (Intersection) 


关系 与 S$ 具 有 相同 的 关系 模式 ， 关 系 R 与 8 的 交 由 属于 R 同时 又 
合 ， 关 系 尺 与 5 的 交 记 作 R 站 S ， 其 形式 定义 如 下 : 
RNS={lteRAtes} 


属于 $ 的 元 组 构成 的 
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显然 ，RnS=R-(R-S)， 或 者 RnS=S-(S-R)。 
2. 连接 (Join) 
连接 分 为 6 连接 、 等 值 连接 及 自然 连接 三 种 。 连 接 运 算是 从 两 个 关系 尺 和 8 的 笛 卡 儿 积 中 
选取 满足 条 件 的 元 组 。 因 此 ， 可 以 认为 笛 卡 儿 积 是 无 条 件 连接 ， 其 他 的 连接 操作 认为 是 有 条 件 
连接 。 下 面 分 述 如 下 。 
(1) 6 连接 


6 连接 是 从 尽 与 8 的 笛 卡 儿 积 中 选取 属性 间 满 足 一 定 条 件 的 元 组 。 其 形式 定义 如 下 ; 
Re4S=¥t=<1",t” >At"” Ee RAt™ eSAt"[X]Ot"[Y] 
XOY 


其 中 : 'XOY' 为 连接 的 条 件 ，9 是 比较 运算 符 , 了 和 7 分 别 为 R 和 5S 上 度数 相等 ， 且 可 比 
的 属性 组 。t"[Y] 表 示 R 中 z" 元 组 的 相应 于 属性 了 的 一 个 分 量 。1”[ 了 7 了] 表示 5 中 tw 元 组 的 相 
应 于 属性 了 的 一 个 分 量 。 需 要 说 明 的 是 : 

。 0 连接 也 可 以 表示 为 : 
RPAS=¥t=<1",t™” >At” ERAt™ <SAzDozm[ 咱 

i01 

其 中 : 123..n ，J=1,2,3,…,m ，'i9 让 的 含义 为 从 两 个 关系 和 5 中 选取 RR 的 第 i 
列 和 5S 的 第 j 列 之 间 满足 9 运算 的 元 组 进行 连接 。 

。 连接 可 以 由 基本 的 关系 运算 笛 卡 儿 积 和 选取 运算 导出 。 因 此 0 连接 可 表示 为 : 

ReRS-oxor(RXS) 或 Rea3= iawn (RXS) 


【 例 7.3】 设 有 关系 R、$8 如 图 7-5 所 示 , 求 R ea 3。 


R.A<S.B 


(a) 关系 尺 (b) 关系 5 


图 7-5 关系 R、5S 


解 : 本 题 连接 的 条 件 为 RA4<5.B, 意 为 将 RR 关系 中 属性 4 的 值 小 于 S 关 系 中 属性 B 的 值 的 
元 组 取出 来 作为 结果 集 的 元 组 。 结果 集 为 RXS 后 选 出 满足 条 件 的 元 组 , 并 且 结 果 集 的 属性 为 : 
R.A，R.B，R.C，S.4，S.B，S.C。 结 果 如 图 7-6 所 示 。 
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R.A R.B RC S.A S.B S.C 
1 2 3 4 6 7 
1 2 3 6 8 9 
2 1 4 4 6 7 
2 1 4 6 8 9 
4 5 4 6 7 
这 4 5 6 8 9 
4 6 7 4 6 时 
4 6 7 6 8 9 


(2) 等 值 连接 (Equijoin) 
当 8 为 “=” 时 ， 称 之 为 等 值 连接 ， 记 为 Ra S 。 其 形式 定义 如 下 : 


X=Y 


Roa S= 仔 =<1t",t™ >At" ERAt™ eSAm[X]=1"[Y]} 
X=Y 


(3) 自然 连接 (Natural Join) 是 一 种 特殊 的 等 值 连接 ， 它 要 求 两 个 关系 中 进行 比较 的 分 量 
必须 是 相同 的 属性 组 ， 并 且 在 结果 集中 将 重复 属性 列 去 掉 。 

车 t" 表示 R 关系 的 元 组 变量 ，1” 表示 8 关系 的 元 组 变量 ; R 和 8 具有 相同 的 属性 组 B， 
且 B=(B,B,,…,Bk); 并 假定 R 关系 的 属性 为 和, 如 ,4 已 B,B ,Bt ，S 关系 的 属性 为 
及 ,8 Bk,BkisBkw2,…,Bn; 为 5 的 元 组 变量 1” 去 掉 重 复 属性 B 所 组 成 的 新 的 元 组 变量 为 
tw” 。 自 然 连接 可 以 记 为 Rea 5 ， 其 形式 定义 如 下 : 

ReaS= {a =<1",1m >At" eRAt™m ESARB=5.B AR.B, =S.B A.…AR.B, =5.B,) 

自然 连接 可 以 由 基本 的 关系 运算 笛 卡 儿 积 和 选取 运算 导出 ， 因 此 自然 连接 可 表示 为 : 

Re4S= Wy 过 ,RBIR.B)- RBK ,Bk #1 BR TB (Cn =5.Bk (R x 5)) 

特别 需要 说 明 的 是 : 一 般 连 接 是 从 关系 的 水 平方 向 运算 ， 而 自然 连接 不 仅 要 从 关系 的 水 平 
方向 ， 而 且 要 从 关系 的 垂直 方向 运算 。 因 为 自然 连接 要 去 掉 重 复 属性 ， 如 果 没 有 重复 属性 ， 那 
么 自然 连接 就 转化 为 笛 卡 儿 积 。 

【 例 7.4】 设 有 关系 RR 与 S$ 如 图 7-7 (a)、(b) 所 示 ， 求 : Rb45。 

解 : 本 题 要 求 R 与 5 关系 的 自然 连接 ， 自 然 连接 是 一 种 特殊 的 等 值 连接 , 它 要 求 两 个 关系 中 
进行 比较 的 分 量 必须 是 相同 的 属性 组 ,并 且 在 结果 中 将 重复 属性 列 去 掉 。 本 题 R 与 S$ 关系 中 相同 
的 属性 组 为 AC， 因 此 ， 结 果 集 中 的 属性 列 应 为 : ABCD。 其 结果 如 图 7-7(c) 所 示 。 
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A | C :| 
a b [4 
b a a c d 
a A B G D 
c d e a b c d 
b d g 
d g b a d 
(a) 关系 RR (b) 关系 5 (c) RpaS 
图 7-7 关系 R、S、RP4aS 
3. 除 (Division) 


除 运算 是 同时 从 关系 的 水 平方 向 和 垂直 方向 进行 运算 。 给 定 关系 R(X,Y) 和 
S(Y,Z), 了 六 Z 为 属性 组 。R*+S 应 当 满足 元 组 在 上 的 分 量 值 x 的 象 集 】 包 含 关系 5 在 
属性 组 Y 上 投影 的 集合 。 其 形式 定义 如 下 : 

RS="[X]lr" eRAn,(S)c Yr.) 
其 中 ， 卫 为 x 在 R 中 的 象 集 ，x=1"[X]。 且 R=+S 的 结果 集 的 属性 组 为 盛 。 
【 例 7.5】 设 有 关系 RR、S 如 图 7-8 (a)、(b) 所 示 ， 求 : RS 。 


A B € D 

a b c¢ d 

a b e f 

a b h k 

b d e f 

bialali 

I ee 

c k e f c k 
(a)R (b) 8S (c) R+S 


图 7-8 关系 R、S、R+S 

解 : 根据 除法 定义 ， 此 题 的 盛 为 属性 48B, 7 为 属性 CD。R=*S 应 当 满 足 元 组 在 属性 4B 
上 的 分 量 值 x 的 象 集 Y. 包 含 关系 5 在 CD 上 投影 的 集合 。 

关系 8 在 了 上 的 投影 为 zco (8S)={(cd),(ey)} 。 对 于 关系 R， 属 性 组 XX ( 即 4B) 可 以 取 
3 个 值 {(a,5),(b,d),(c,k)} ， 它 们 的 象 集 分 别 为 : 

象 集 CDua = {(ca),(ez), (et 

象 集 CDoo = {(ef),(a0)} 

象 集 CDb = {(c.a),(e/)} 
1 于 上 述 象 集 包含 xco (5) 有 (a,b) 和 (c,k) ,所 以 ， RS={(a,b),(c,k)) ,结果 如 图 7-8 (ec) 


了 
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【 例 7.6】 设 学 生 课程 数据 库 中 有 : 学 生 S、 课 程 C、 学 生 选 课 SC 三 个 关系 ， 如 图 7-9 所 
示 。 请 用 关系 代数 表达 式 表 达 如 下 检索 问题 。 

(1) 检索 选修 课程 名 为 “数学 ”的 学 生 号 和 学 生 姓 名 。 

(2) 检索 至 少 选修 了 课程 号 为 “1” 和 “3” 的 学 生 号 。 

(3) 检索 选修 了 “操作 系统 ”或 “数据 库 ” 课 程 的 学 号 和 成 绩 。 

(4) 检索 年 龄 在 18 到 20 之 间 ( 含 18 和 20) 的 女生 的 学 号 、 姓 名 及 年 龄 。 

(5) 检索 选修 了 “ 刘 平 ”老师 所 讲课 程 的 学 生 的 学 号 、 姓 名 及 成 绩 。 

(6) 检索 选修 全 部 课程 的 学 生 姓名 。 

(7) 检索 选修 课程 包括 “1042” 学 生 所 学 的 课程 的 学 生 学 号 。 

(8) 检索 不 选修 “2” 课 程 的 学 生 姓 名 和 所 在 系 。 


Sno | Sname Sex sD Age | 
3001 王 平 女 计算 机 18 
3002 张 勇 务 计算 机 19 
4003 黎 明 女 机 械 18 
4004 刘 明 远 田 机 械 19 
1041 赵 国庆 男 通 信 20 
1042 樊 建 簿 男 通 信 20 


Cname 
1 数据 库 
2 数 学 
3 操作 系统 
4 数据 结构 
5 . 
6 

7 


信息 系统 
程序 设计 


C 


图 7-9 S、C、SC 关 系 

解 :(1) 检索 选修 课程 名 为 “数学 ”的 学 生 号 和 学 生 姓名 的 关系 代数 表达 式 有 如 下 两 种 表 

示 方 法 : 
fgnossname (Coname-¥'(S PASCPAC) 或 zz(G8iy'(S PA SC Pac)) 

对 于 上 述 表 达 式 $ pa SC Pa C 自然 连接 后 重复 的 属性 列 为 学 号 Sno 和 课程 号 Cno， 去 掉 
重复 属性 列 的 结果 如 图 7-10 所 示 。 从 图 中 可 见 ， 满 足 课程 名 为 “数学 ”的 只 有 三 个 元 组 ， 在 此 
基础 上 进行 wo swame 投影 的 结果 如 图 7-11 所 示 。 由 于 Sno、Sname 和 Cname 分 别 对 应 第 1、2 
和 8 列 属性 ， 所 以 上 述 表 达 式 还 可 以 写 为 : za (G8_ gy (S pa SC pa C)) as 
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Sno Sname | Sex sD Age Cno |Grade | Cname Pcno |Credit 

3001 | 王 平 | 女 | 计算 机 18 1 83 数据 库 3 3 

3001 | 王 女 | 计算 机 18 2 84 数 学 4 

3001 | 王 平 | 女 | 计算 机 18 3 4 操作 系统 | 4 4 

3002 | 张 勇 | 男 | 计算 机 19 汪 3 数 学 4 Sno Sname 

3002 | 张 勇 | 男 | 计算 机 19 3 3 “| 操作 系统 | 4 4 3001 兰 胖 

1042 | 攀 建 簿 | 男 | 通 信 | 20 1 4 数据 库 3 3002 张 勇 

1042 | 攀 建 簿 | 男 | 通 信 20 ;3 82 数 学 4 1042 枢 建 给 

图 7-10 SpaSCp4aC 图 7-11 zgno,sname 

(2) 检索 至 少 选修 了 课程 号 为 “1” 和 “3” 的 学 生 号 的 关系 代数 表达 式 有 如 下 两 种 表示 


方式 。 
A (viens (SC 义 SC)) 或 XSno,Cno (SC)= rom (Ga (C)) 

@ 而 (Gianzamnsza(SCXSC)) 分 析 如 下 。 

若 设 SCX SC 中 的 第 一 个 SC 关系 为 81， 第 二 个 SC 关系 为 22, 那么 SC X SC 的 结果 属性 
列 名 为 : S1.Sno、S1.Cno、S1.Grade、S2.Sno、S2.Cno、S2.Grade。 

关系 表达 式 石 (aya-tws-s'(SCXSC)) 的 含义 为 先 从 SC X SC 中 选取 第 1 列 属性 值 等 
第 4 列 属 性 值 ( 等 价 于 S1.Sno 二 S2.Sno); 同时 又 满足 第 2 列 属性 值 等 于 1( 等 价 于 S1.Cno 一 1 ) 
的 元 组 :同时 还 满足 第 5 列 属性 值 等 于 3 等 价 于 S2.Sno 王 3?) 的 元 组 ， 最 后 投影 第 一 个 属性 
列 Sno 即 为 所 求 结果 集 。 

© XSno, Cno (SC)= XCno (casavaoc3(C)) 分 析 如 下 这 

表达 式 zcwo(Gcwo_rvcno-3(C) 就 是 构造 一 个 临时 关系 K， 其 属性 为 Cno， 结 果 如 下 : 

K = cno (Geno vcno=s(C))= {1,3} 

查询 表达 式 zswo,cwo (SC)*+ 的 结果 集 的 学 生 号 Sno 所 选 的 课程 号 应 包括 K， 所 以 ,求解 
的 过 程 就 是 对 zso_cwo (SC ) 的 每 一 个 元 组 逐一 求 某 一 学 生 的 象 集 。 因 为 所 求 的 结果 集 为 Sno、 
义 为 Sno、Y 为 Cno、 象 集 为 Cnos,。， 所 以 ， 将 Sno 的 值 逐一 代入 求 得 的 象 集 为 : 

Cnoiool = 和 ,2,3} ”表示 学 号 为 3001 的 学 生 选 修了 课程 号 为 1、2、3 的 课程 ; 

Cnos002 = {2,3} 表示 学 号 为 3002 的 学 生 选 修了 课程 号 为 2、3 的 课程 ; 

Cnoios = {1,2} 表示 学 号 为 1042 的 学 生 选 修了 课程 号 为 1、2 的 课程 。 

从 上 分 析 可 以 看 出 ， 只 有 3001 包含 了 天 在 Cno 的 投影 ， 所 以 rwo oo(SC): 天 = 8001}。 


(3) 检索 选修 了 “操作 系统 ”或 “数据 库 ” 课 程 的 学 号 和 姓名 的 关系 代数 表达 式 如 下 ， 分 
析 略 。 


nN 


A Sno, Sname (s bg (Gname- 品 作 系统 vcname- 数 据 库 (SC Pq c) 
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(4) 检索 年 龄 在 18 到 20 之 间 〈 含 18 和 20) 的 女生 的 学 号 、 姓 名 及 年 龄 的 关系 代数 表达 
式 如 下 ， 分 析 略 。 


A Sno, Sname, Age fc Age<'18'A\ Age>'20' (s ) 
(5) 检索 选修 了 “数据 库 ” 课 程 的 学 生 的 学 号 、 姓 名 及 成 绩 的 关系 代数 表达 式 如 下 ， 分 
析 略 。 
snowSname,Grade (Ccname- 数 据 库 (SP4 SC paC)) 
(6) 检索 选修 全 部 课程 的 学 生 姓名 及 所 在 系 的 关系 代数 表达 式 如 下 : 


ZT, Sname, SD (s Da (rx Sno,Cno (SC) NACno (0) 


本 题 求解 过 程 分 析 如 下 。 

@ 表示 全 部 课程 的 临时 关系 K = zcno(C)= {1,2,3,4,5,6,7}。 

@ 查询 选修 了 所 有 课程 的 学 生 号 为 zwo cwo(SC)+KK = {和 )， 因 为 学 生 3001 的 学 生 选 修 
了 课程 号 为 1、2、3 的 课程 ，3002 的 学 生 选 修了 课程 号 为 2、3 的 课程 ，1041 的 学 生 选 修了 课 
程 号 为 1、2 的 课程 ， 所 以 3001、3002 和 1042 都 没有 包含 天 ， 故 结果 集 为 空 。 

@ 与 $ 关系 进行 自然 连接 后 ， 再 对 学 生 Sname 和 SD 投影 的 结果 也 为 空 。 

(7) 检索 选修 课程 包含 “1042” 学 生 所 学 的 课程 的 学 生 学 号 的 关系 表达 式 如 下 ， 分 
析 略 。 


元 Sno,Cno (SC)= XCno (Gsmon 042' (5 C) 
(8) 检索 不 选修 2 课程 的 学 生 姓 名 和 所 在 系 的 关系 代数 表达 式 如 下 ， 分 析 略 。 


Tsname, SD (SC) — Xsname,sD (Gm (5 Xx SC)) 或 X24 (SC)- X24 (G6 (S Da SC) 
4. 广义 投影 《Generalized Projection) 


广义 投影 运算 允许 在 投影 列表 中 使 用 算术 运算 ， 实 现 了 对 投影 运算 的 扩充 。 
若 有 关系 有 R， 条 件 五 , 柬 ,…… 忆 中 的 每 一 个 都 是 涉及 尺 中 常量 和 属性 的 算术 表达 式 ， 那 么 
广义 投影 运算 的 形式 定义 为 : zp (R)。 
【 例 7.7】 信贷 额度 关系 模式 credit-in(C_name, limit Credit_ balance)， 属 性 分 别 表示 用 户 姓 
名 、 信 贷 额度 和 到 目前 为 止 的 花费 。 图 7-12 (a) 表示 了 一 个 具体 的 关系 credit-in。 查 询 每 个 


户 还 能 花费 多 少 的 关系 代数 表达 式 和 查询 结果 。 
解 ， 关 系 代数 表达 式 为 ze uneimiLesait_umes (credit 一 加 ) ， 查 询 结果 如 图 7-12 (b) 所 示 。 
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C_name limit | Credit_balance C name | Limit — Credit_balance 
工 伟 峰 2500 1800 工 伟 峰 700 
吴 桢 3100 2000 吴 村 1100 
黎 建 明 2380 2100 黎 建 明 280 
刘 柯 5600 3600 刘 柯 2000 
徐 国 平 8100 5800 徐 国 平 2300 
景 莉 红 6000 4500 景 莉 红 1500 
(a) credit-in (b) Ac _name,limit—credit_balance (credit 和 in) 


图 7-12 信贷 额度 关系 


5. 外 连接 (Outer Jion) 


图 7-9 的 S 和 SC 关系 ， 当 进 


外 连接 运算 是 连接 运算 的 扩展 ， 可 以 处 理 缺 失 的 信息 。 对 于 
行 S baSC 的 自然 连接 时 ， 其 结果 如 图 7-13 所 示 。 
Sno | Sname Sex | sD | Age Cno Grade 
3001 EE -和 T 女 计算 机 18 1 93 
3001 EE 村 女 计算 机 18 2 84 
3001 E 女 计算 机 18 3 84 
3002 张 勇 男 计算 机 19 2 83 
3002 张 勇 男 计算 机 19 3 93 
1042 | 枢 建 牌 男 | 通 信 20 1 84 
1042_| 攀 建 簿 男 | 通 信 20 2 82 
图 7-13 SPp4aSC 


从 图 7-13 可 以 看 出 5S 与 SC 的 自然 连接 Sea SC 的 结果 丢失 了 黎明 、 


和 全 外 连接 。 
@ 左 外 连接 (Left Outer Jion) 了 4 


刘 明 远 、 赵 国庆 的 信 
息 。 可 是 ， 使 用 外 连接 就 可 以 避免 这 样 的 信息 丢失 。 外 连接 运算 有 三 种 : 左 外 连接 、 右 外 连接 


左 外 连接 : 取出 左 侧 关系 中 所 有 与 右 侧 关系 中 任 一 元 组 都 不 匹配 的 元 组 ， 


所 有 来 自 右 侧 关系 的 属性 ， 构 成 新 的 元 组 ， 将 其 加 入 自然 连接 的 结果 
关系 ， 当 我 们 对 其 进行 左 外 连接 8 了 4SC 时 ， 其 结果 如 图 7-14 所 示 。 


@) 右 外 连接 (Right Outer Jion) XC 


右 外 连接 : 取出 右 侧 关 系 中 所 有 与 左 侧 关 系 中 
所 有 来 自 左 侧 关 系 的 属性 ， 构 成 新 的 元 组 ,将 其 加 入 自然 连接 的 结果 


用 空 值 null 充填 


Ph 。 对 于 图 7-9 的 S 和 SC 


Ph 任 一 元 组 都 不 匹配 的 元 组 ， 


关系 ， 当 我 们 对 其 进行 右 外 连接 SC IXLC 时 ， 其 结果 如 图 7-15 所 示 。 


空 值 null 填充 


Ph 。 对 于 图 7-9 的 S 和 SC 
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Sno Sname Sex SD Age Cno Grade 
3001 下 - 平 -| 玄 计算 机 18 1 93 
3001 王 平 | 女 | 计算 机 18 2 84 
3001 王 平 | 女 | 计算 机 18 3 84 
3002 | 张 勇 | 男 | 计算 机 19 2 83 
3002 | 张 勇 | 男 计算 机 19 3 93 
4003 | 黎明 | 女 | 上 | 机 械 18 Null Null 
4004 刘 明 远 男 机 械 19 Null Null 
1041 赵 国庆 男 | 通 信 20 Null Null 
1042 | 樊 建 簿 男 | 通信 20 1 84 
1042 | 樊 建 年 男 | 通 信 20 2 82 
图 7-14 _ SJxsc 
Sno Cno Grade Cname Pcno Credit 
3001 1 93 数据 库 a 3 
3001 2 84 数 学 4 
3001 3 84 操作 系统 4 4 
3002 2 83 数 学 4 
3002 3 93 操作 系统 4 4 
1042 1 84 数据 库 3 3 
1042 2 82 数 学 4 
Null 4 Null 数据 结构 2 3 
Null 5 Null 数字 通信 6 3 
Null 6 Null 信息 系统 1 4 
Null 7 Null 程序 设计 2 2 
图 7-15 SQXLC 


@ 全 外 连接 (Full Outer Jion) PC 


全 外 联接 : 完成 左 外 连接 和 右 外 连接 的 操作 。 即 填充 左 侧 关 系 中 所 有 与 右 侧 关 系 中 


P 任 一 元 


组 都 不 匹配 的 元 组 ， 又 填充 右 侧 关系 中 所 有 与 左 侧 关 系 中 任 一 元 组 都 不 匹配 的 元 组 ， 将 产生 的 


新 元 组 加 入 自然 连接 的 结果 中 。 
【 例 7.8】 设 有 关系 及 、$8 如 图 7-16 所 示 , 求 : RS、RXLS、RDCS。 
A B 这 B GD 
a b C b 6 d 
b a d d e g 
d a f d g 
d 在 g d e c 
(a) 关系 R (b) 关系 5 


图 7-16 关系 R、5S 
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解 : 对 于 图 7-16 的 R、S 关系 ， 当 对 其 进行 左 外 连接 RJAIS 、 右 外 连接 RIXLS 以 及 全 外 
联接 RJXLS 时 ， 其 结果 分 别 如 图 8-17 (a)、(b) 和 (c) 所 示 。 

A B [ D A B Lo D A B C D 

a b ce d a b c d a b 9 d 

c d e g C d 3 g C d e g 

c d e C c d e C C d e C 

b a d null null * d g b a d null 

d f g null d f g null 
null f d g 

(a) 左 外 连接 R 了 Ss (b) 右 外 连接 R XLS (c) 全 外 连接 RES 

图 7-17 外 连接 举例 
6 聚集 函数 


聚集 运算 是 关系 代数 运算 中 的 一 个 非常 重要 的 扩展 。 聚 集 函 数 输入 一 个 值 的 集合 ， 返 回 单 
一 值 作为 结果 。 例 如 ， 集 合 {2,4,6,8,10,15} 。 将 聚集 函数 sum 用 于 该 集合 时 返回 和 45; 将 聚集 
函数 avg 用 于 该 集合 时 返回 平均 值 7.5; 将 聚集 函数 count 用 于 该 集合 时 返回 集合 中 元 数 的 个 数 
6; 将 聚集 函数 min 用 于 该 集合 时 返回 最 小 值 2; 将 聚集 函数 max 用 于 该 集合 时 返回 最 大 值 15。 

需要 说 明 的 是 ， 使 用 聚集 函数 的 集合 中 ， 一 个 值 可 以 出 现 多 次 ， 值 出 现 的 顺序 是 无 关 紧 要 
的 ， 这 样 的 集合 称 之 为 多 重 集 。 集 合 是 多 重 集 的 一 个 特例 ， 其 中 每 个 值 都 只 出 现 一 次 。 

但 是 ， 有 时 在 计算 聚集 函数 前 必须 去 掉 重 复 值 ， 此 时 可 以 将 “distinct” 用 连接 符 附 加 在 函 
数 名 后 ， 如 count-distinct。 

【 例 7.9】 学 生 选 课 关 系 SC 如 图 7-18 所 示 ， 请 求 出 : 选课 关系 中 出 现 的 课程 数 ， 每 门 课 
程 所 选 的 学 生 数 ， 每 门 课程 的 平均 成 绩 以 及 最 高 成 绩 。 

解 : 对 于 “选课 关系 中 出 现 的 课程 数 ”应 该 每 门 课 程 只 计算 一 次 ， 
而 不 管 该 门 课程 有 多 少 学 生 选 。 其 查询 表达 式 为 : 

count — distinctcno (SC ) 

对 于 “每 门 课程 所 选 的 学 生 数 ” 应 该 按 课 程 号 分 组 ， 组 内 统计 学 

生 数 。 其 查询 表达 式 为 : 
Cno G Countsno (sc) 

聚集 运算 符 G 左 侧 的 属性 Cno 表示 输入 关系 SC 必须 按照 Cno 
的 值 进行 分 组 ， 结 果 如 图 7-19 (a》 所 示 ; 然后 统计 各 个 组 中 的 学 生 
数 ， 统 计 的 结果 如 图 7-19 (b) 所 示 。 

对 于 “每 门 课 程 的 平均 成 绩 以 及 最 高 成 绩 ” 应 该 按 课程 号 分 组 ， 组 内 求 平 均值 ， 并 寻找 最 
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高 成 绩 。 其 查询 表达 式 为 : 
Cno Gaveg. Grade, MaX Grade (5 C) 
求 “ 每 门 课 程 的 平均 成 绩 以 及 最 高 成 绩 ” 结 果 如 图 7-19 〈c) 所 示 。 


Sno 
3001 
2010 


Cno | Student -num 
1 3 


2 3 


1042 3 2 

3001 (b) 

3002 Cno avg of Grade | max of Grade 
I 1 877 93 
3001 2 83 84 
3002 3 88.5 93 


图 7-19 聚集 函数 实例 
7.3 ”元 组 演算 


元 组 关系 演算 是 非 过 程 化 查询 语言 。 它 只 描述 所 需 信 息 ， 而 不 给 出 获得 该 信息 的 具体 过 程 。 
在 元 组 关系 演算 中 , 其 元 组 关系 演算 表达 式 中 的 变量 是 以 元 组 为 单位 的 , 其 一 般 形式 为 : 长 |P()}。 
其 中 : 1 是 元 组 变量 ，P(t) 是 元 组 关系 演算 公式 ， 公 式 是 由 原子 公式 组 成 的 。 


7.3.1 原子 公式 


原子 命题 函数 是 公式 ， 简 称 为 原子 公式 。 它 有 下 面 三 种 形式 。 
(1) R(t) 。R 是 关系 名 ,1 是 元 组 变量 ，R(t) 表 示 这 样 一 个 命题 “t 是 关系 的 一 个 元 组 ”。 
(2) [i]9C 或 Cgt 国 。! 国 表示 元 组 变量 ! 的 第 ;个 分 量 ，C 是 常量 ， 为 算术 比较 运算 符 。 
i6C 或 C91[i] 表示 这 样 一 个 命题 “元 组 变量 1 的 第 i 个 分 量 与 C 之 间 满 足 9 运算 ”。 
例如 ，i[3]<'8' 表 示 1 的 第 三 个 分 量 小 于 8。1[2]- ,数据 库 ,表示 :的 第 二 个 分 量 等 于 “数据 
“(3) AiJ0u[j] 。 tu 是 两 个 元 组 变量 ，t[i]9u[ 月 表示 这 样 一 个 命题 “元 组 变量 ! 的 第 i 
个 分 量 与 元 组 变量 的 第 j 个 分 量 之 间 满 足 运算 ”。 
例如 ，i[2]>u[4] 表示 的 第 二 个 分 量 大 于 等 于 的 第 四 个 分 量 。 
7.3.2 ”公式 的 定义 


若 一 个 公式 中 的 一 个 元 组 变量 前 有 全 称 量词 Y 或 存在 量词 3 符号 ， 则 称 该 变量 为 约束 变 
量 ， 否 则 称 之 为 自由 变量 。 公 式 可 递归 定义 如 下 : 
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(1) 原子 公式 是 公式 。 

(2) 如 果 g 1 和 g ,5 是 公式 ， 那么 ， 一 91，91V92，91 和 92，9 1 入 92 也 都 是 公式 。 
分 别 表示 这 样 如 下 命题 : 一 1 表示 “1 不 是 真 ”9 1vV 9 5 表示 “9 1 或 9 ?为 真 ” 9 1 和 9 5 表 
示 “91 和 9g ,都 为 真 ””9 1 过 9s 表示 “ 若 9 1 为 真 则 g ,为 真 ”。 

(3) 如 果 g 1 是 公式 , 那么 ，3t(g 1 ) 是 公式 。31(g 1 ) 表 示 这 样 一 个 命题 “ 若 有 一 个 t 使 p 1 
为 真 ， 则 3t(o 1) 为 真 ， 否 则 3t(p 1 ) 为 假 ”。 

(4) 如 果 g 1 是 公式 ， 那 么 ，Vt(g 1 ) 是 公式 。Vt(g |) 表示 这 样 一 个 命题 “车 对 所 有 的 t 
使 p 1 为 真 ， 则 Vit(g 1 ) 为 真 ， 否则 Vi(g 1 ) 为 假 ”。 

公式 中 运算 符 的 优先 顺序 如 下 : 

算术 比较 运算 符 9 、 习 和 忌 、 一 、 入 和 v 、 僵 。 加 括号 时 ， 括 号 中 的 运算 符 优先 。 
7.3.3 ”关系 代数 运算 转换 为 元 组 演算 表达 式 


关系 代数 表达 式 可 以 用 元 组 演算 表达 式 表 示 。 由 于 任何 一 个 关系 代数 表达 式 都 可 以 用 五 种 
基本 的 关系 运算 组 合 表示 ， 因 此 ， 我 们 只 需 给 出 五 种 基本 的 关系 运算 用 元 组 演算 表达 式 表 示 形 
式 即 可 。 


1. 并 

运算 用 元 组 演算 表达 式 可 表示 为 : RUS= 他 R(CO)v SG 
2. 差 

差 运算 用 元 组 演算 表达 式 可 表示 为 : R-8 = 他 R(OD)A 一 S( 
3. 笛 卡 儿 积 的 元 组 演算 表达 式 


假定 关系 有 nn 个 属性 , 关系 S 有 m 个 属性 ， 则 RXS 后 生成 的 新 关系 是 ntm 目 关 系 ， 即 
有 ntm 个 属性 。 其 元 组 演算 表达 式 为 : 
RxS = {A(3u)3vARC) A SE AU = uA Atn] = un] tn+1]= vA Atn tm] = vm)} 


4. 投影 


投影 运算 用 元 组 演算 表达 式 表示 如 下 : 
zisias si (R)= {uNR) A = ua NA2 = ui2 A A] = ui 


5. 选择 
选择 运算 用 元 组 演算 表达 式 可 表示 为 ， ap(R)= 长 | RO) 和 FF} 
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【 例 7.10】 设 有 关系 R、S 如 图 7-20 所 示 , 对 如 下 所 示 的 元 组 演算 表达 式 , 求 出 它们 的 值 。 


A | A B 如 

1 2 3 3 7 四 

4 5 6 4 5 6 

8 9 5 9 13 

10 1 12 6 10 14 
R S 


图 7-20 关系 R、8 

(1) R1={|R(O)A-S() 

(2) R2={|(3uXRO)A Su) A < ul2))} 

(3) R3={| (vuXR(O) A Su) 3] > ul1) 

(4) R4={|(3u)3vARC) A Sy) Au2] > vA =u] A2]= vAd3]= v3]} 

解 : 例 7.10 求解 过 程 分 析 如 下 。 

分 析 (1) R1= 攻 | R()^ 一 S(t》} 的 含义 为 : 新 生成 的 关系 RI 中 的 元 组 来 自 关系 R， 但 该 
元 组 又 不 在 关系 8 中 。 查 询 结果 如 图 7-21 〈a) 所 示 。 

分 析 (2) R2= 攻 | GujR(O)ASGo)AtB]<z[2] 直 的 含义 为 ， 新 生成 的 关系 R2 中 的 元 组 
来 自 关系 R， 但 该 元 组 的 第 三 个 分 量 值 必 须 小 于 关系 8 中 某 个 元 组 的 第 二 个 分 量 值 。 查 询 结果 
如 图 7-21 (b) 所 示 。 


4 3 11 
4 4 6 
7 3 11 
7 4 6 
7 5 13 
~ 6 14 
10 3 11 
10 4 6 
10 过 13 
10 6 14 
(d) R4 
图 7-21 RI、R2、R3 和 R4 
分 析 (3) R3 = 长 (Yuj(R(OJAS(e)AtB]>x[D 外 的 含义 为 : 新 生成 的 关系 R3 中 的 元 组 来 


自 关 系 R， 但 该 元 组 的 第 三 个 分 量 值 必须 小 于 关系 8 中 任意 一 个 元 组 的 第 一 个 分 量 值 。 查 询 结 
果 如 图 7-21 (c) 所 示 。 
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分 析 (4) R4= 人 xjBvJR(o)ASs@)Aar2]>yTAD=xAt2]=?mAtB]=v[3 直 的 含义 
为 新 生成 的 关系 R4 来 自 关系 R 和 S， 其 中 : x[2]> 如 ] 含义 为 新 生成 的 关系 R4 中 的 元 组 需要 
满足 及 第 二 个 分 量 >S 第 一 个 分 量 ; t[1]=u[1] 入 t[2]=v[1] 和 At[3]= v3] 的 含义 为 结果 集 元 组 变量 的 
三 个 分 量 t0]、t[2]、zt[3] 应 满足 [1] =wu[1] 、t[2]=vl1] 和 1[3]=v[3] ， 分 别 表 示 第 一 个 分 量 为 
关系 R 的 第 一 个 分 量 , 第 二 个 分 量 为 关系 8 的 第 一 个 分 量 , 第 三 个 分 量 为 关系 5 的 第 三 个 分 量 。 
查询 结果 如 图 7-21 (d) 所 示 。 
【 例 7.11】 对 于 例 7.6 学 生 课程 数据 库 中 的 三 个 关系 : 学 生 关系 S、 课 程 关 系 C、 学 生 选 
课 关 系 SC 如 图 7-9 所 示 。 请 用 元 组 演算 表达 式 完 成 例 7.6 中 的 查询 问题 。 
解 : 
(1) 检索 选修 课程 名 为 “数学 ”的 学 生 号 和 学 生 姓名 的 元 组 演算 表达 式 为 : 
人 flBuxjBvjBwJs@)JAsce)Actw)Aa=wDAyD2]=wtAwt2]= 数 学 wm=xDAt2]=x2 直 
(2) 检索 至 少 选修 了 课程 号 为 “1” 和 “3 ”的 学 生 号 的 元 组 演算 表达 式 为 ; 
{| uavXsc) A Sc) Aul] = vw Au2] =TAv2]=3t=z} 
(3) 检索 选修 了 “操作 系统 ” 或“ 数据库” 课程 的 学 号 和 姓名 的 元 组 演算 表达 式 为 :; 
{全 (3WDGWEw(S() A SC ) A CW) A = WA v2]= wll]^ (wf2]=' 操 作 系统 vwf2]=' 数 据 库 ') 
入 =u[J 和 d2]=w[2 功 
(4) 检索 年 龄 在 18 到 20 之 间 ( 含 18 和 20) 的 女生 的 学 号 、 姓 名 及 年 龄 的 元 组 演算 表达 
式 为 : 


{| GuXs (0) A us] >18wu[5] <'20wz[3] =' 女 wtm = wl] Att2] = ul2] dt3] = u[5])} 
(5) 检索 选修 了 “数据 库 ”课程 的 学 生 的 学 号 、 姓 名 及 成 绩 的 元 组 演算 表达 式 为 : 
{| Gu)BvawXsC) asc) A Cw) au = A M2]= WA MW2] = 数据 库 ' 
和]=u[]Ad2]=w2]Ad3]=w3 臣 
(6) 检索 选修 全 部 课程 的 学 生 姓名 及 所 在 系 的 元 组 演算 表达 式 为 : 
{| Bu)(vv)Bw)(s) A Cy) A SC(w) A = MA M2 = WA =u2] A 2] = 4)» 
(7) 检索 选修 课程 包括 “1042” 学 生 所 学 的 课程 的 学 生 学 号 的 元 组 演算 表达 式 为 : 
{#1(au)(sc() A (vv)(sSc(v) A C=1042'= 3w)(SC(W) A w= A A= 2) A = 
本 问题 解 题 思 路 是 ， 在 SC 关系 中 依次 检查 “1042” 所 选修 的 课程 ， 再 看 某 一 个 学 生 是 否 
也 选修 了 该 门 课 。 如 果 对 于 “1042” 所 选修 的 每 门 课程 给 学 生 都 选修 了 ， 则 该 学 生 为 满足 条 件 
的 学 生 ， 将 所 有 的 学 生 都 找 出 来 即 完 成 了 本 题 的 要 求 。 
(8) 检索 不 选修 2 课程 的 学 生 姓 名 和 所 在 系 的 元 组 演算 表达 式 为 : 
{i1(Bu)(vv)(SC) A SC) A C= M2) A =A = 
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注意 : 当 查 询 涉及 到 否定 或 全 部 值 时 ， 就 要 用 到 差 操 作 或 除法 操作 。 
7.4 域 演 算 


域 关 系 演算 简称 域 演算 。 在 域 演 算 中 ， 表 达 式 中 的 变量 是 表示 域 的 变量 ， 可 将 关系 的 属性 
名 视 为 域 变量 。 
域 演算 表达 式 的 一 般 形式 为 : 
{ht Ph} 
其 中 ，,…,th 是 域 变量 ，P(4,…,h ) 是 域 演算 公式 。 


7.4.1 原子 公式 


原子 命题 函数 是 公式 ， 简 称 为 原子 公式 。 它 有 下 面 三 种 形式 : 

(1) R(4,…,f,…s 检 )。R 是 元 关系 ， ti 是 元 组 变量 1 的 第 i 个 分 量 ，R(4,…,…,4i ) 表 
示 这 样 一 个 命题 “以 如 …6,…, 为 分 量 的 元 组 在 关系 及 中心 

(2) 1410C 或 COt; 。4 表 示 元 组 变量 t 的 第 i 个 分 量 ，C 是 常量 ，0 为 算术 比较 运算 符 。 

(3) 40uj;。4 与 j 是 两 个 域 变 量 ，t; 是 元 组 变量 1 的 第 i 个 分 量 ，uj 是 元 组 变量 x 的 第 
7 个 分 量 它们 之 间 应 满足 运算。 

例如 ，t1 >z4 表 示 上 的 第 一 个 分 量 值 大 于 等 于 x 的 第 四 个 分 量 值 。 


7.4.2 公式 的 定义 

若 一 个 公式 中 的 一 个 元 组 变量 前 有 全 称 量词 v 或 存在 量词 符号 ， 则 称 该 变量 为 约束 变 
量 ， 否 则 称 之 为 自由 变量 。 公 式 可 递归 定义 如 下 : 

(1) 原子 公式 是 公式 。 

(2) 如 果 和 和 2 是 公式 ， 那 么 ，-mW ，91 V92，91 八 9，，9 1 二 9 也 都 是 公式 。 

(3) 如 果 gl 是 公式 ， 那 么 ，34;(qi ) 是 公式 。36 (wm ) 表 示 这 样 一 个 命题 “车 有 一 个 使 gl 
为 真 ， 则 34(gi ) 为 真 ， 否 则 3 (ol ) 为 假 ”。 

(4) 如 果 g (4,…,,…, 胡 ) 是 公式 , 那么 ，Vii(g1 ) 是 公式 。Vt;(p ) 表 示 这 样 一 个 命题 “车 
对 所 有 的 5 使 (4,…,5…,4 ) 为 真 ， 则 Vii(g1 ) 为 真 ， 否 则 Vii(g ) 为 假 ”。 

公式 中 运算 符 的 优先 顺序 如 下 : 

算术 比较 运算 符 9 、 习 和 VYV、 一 、 和 信和 v 、 僵 。 加 括号 时 ， 括 号 中 的 运算 符 优先 。 
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7.4.3 举例 
【 例 7.12】 设 有 关系 R、S 如 图 7-22 所 示 ， 对 如 下 的 域 演算 表达 式 ， 求 出 它们 的 值 。 
A B [3 A B © 
1 2 1 1 2 学 
4 5 7 4 5 6 
8 6 7 8 9 
10 11 9 10 | 11 
R Ss 
图 7-22 关系 R 与 5 
域 演算 表达 式 如 下 : 


(1) Rl={tt | REG)AN <b At, >4} 

(2) R2={ttts |(R(ttsts Mt >4)v (Slits)At, <8) 

(3) R3={ttt [uv Iw)R (utr) A Shwe )Au>7Av>w} 
解 : RI、R2、R3 结果 见 图 7-23， 分 析 如 下 : 


[ATe | 


© 
1 
6 
9 


(Ca)R1 (b)R2 (OR3 
图 7-23 关系 RI、R2 与 R3 


分 析 〈1): 关系 R1 中 的 元 组 来自 关 系 RR， 并 且 必 须 满足 第 一 个 分 量 4 < 第 二 个 分 量 4， 
即 RA<R.B; 同时 还 必须 满足 第 二 个 分 量 1, > 第 三 个 分 量 # ， 即 R.B>R.C。 显 然 ， 从 关系 尺 中 
不 难看 出 ， 只 有 第 二 个 元 组 (4,5, 7) 不 满足 条 件 ， 故 求 得 的 关系 R1 如 图 7-23 (a) 所 示 。 

分 析 (2): 关系 R2 中 的 元 组 + 来自 关系 R 和 关系 S$， 并 且 来 自 关系 R 的 元 组 必须 满足 第 
一 个 分 量 4 >4， 即 R.4>4; 或 来 自 关系 5 的 元 组 必须 满足 第 二 个 分 量 t, <8， 即 5.8<<8。 求 得 
的 关系 R2 如 图 7-23 (b) 所 示 。 

分 析 (3): 关系 R3 中 的 元 组 t 的 分 量 4 来自 关系 8 的 第 一 个 分 量 8.4; 分 量 t 来 自 关系 RR 
的 第 二 个 分 量 R.B; 分 量 # 来 自 关 系 8 的 第 三 个 分 量 S.C; 并 且 要 求 R.4>7 人 AR. C>5. B。 显然， 
求 得 的 关系 R3 如 图 7-23 (c) 所 示 。 

【 例 7.13】 例 7.6 图 7-9 学 生 数 据 库 中 有 S、SC、C， 三 个 关系 请 用 域 演算 表达 式 完成 如 下 
查询 : 
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(1) 检索 男生 是 年 龄 小 于 20 岁 的 学 号 和 姓名 ; 
(2) 检索 选修 了 “数据 库 ” 课 程 的 学 号 和 姓名 。 
解 : 
(1) 检索 男生 且 年 龄 小 于 20 岁 的 学 号 和 姓名 的 域 演算 表达 式 为 : 
人 [EDN ED ED )Gus)Gxs XS (auzusuaus )Aus ="' 男 /Wus <'20'Nt =u At =uy } 
注意 :为 了 书写 方便 (3wu】3w,)ws)ws)us) 可 用 (Bwuwzusuaus ) 的 简化 表示 形式 。 另 外 ， 
上 述 表 达 式 中 由 于 S 关系 中 的 性 别 是 一 个 常量 “ 男 ”"， 因 此 也 可 以 将 表达 式 简 化 成 : 
{hn | Bua Bus XS 男 waus )Aus <'20) 
(2) 检索 选修 了 “数据 库 ” 课 程 的 学 号 和 姓名 的 域 演算 表达 式 为 : 
{hts | (uuzuauaus )JGwvvw )Gw Wa2W3W4 XS(wuusuauaus )^ SC(vivavs )^ C(wiwawawa ) 人 
MU 三 VI 入 V2 = Wi 和信 ws = 数据 库 / =w 人 ts, = 1)} 
上 式 可 以 简化 为 : 
{hn | Gusuaus (3v2vs \3wiwswa Xs (runs )A SC(nvav3) ~ Cnw ' 数 据 库 'waw4)^ 7 =W 》 


7.5 查询 优化 


7.5.1 基本 概念 


1. 查询 处 理 

查询 处 理 是 指 从 数据 库 中 提取 数据 的 一 系列 活动 。 这 一 系列 活动 包括 : 将 高 级 数据 库 语言 
表示 的 查询 语句 翻译 成 为 能 在 文件 系统 这 一 物理 层次 上 实现 的 表达 式 ， 为 优化 查询 进行 各 种 转 
换 ， 以 及 查询 的 实际 执行 。 

2. 查询 处 理 的 代价 

查询 处 理 的 代价 通常 取决 于 磁盘 的 访问 ,磁盘 的 访问 比 内 存 访问 速度 要 慢 。 对 于 一 个 给 定 
的 查询 ， 可 以 有 许多 可 能 的 处 理 策略 ， 复 杂 查 询 更 是 如 此 。 就 所 需 的 磁盘 访问 次 数 而 言 ， 策 略 
好 坏 差 别 很 大 ， 有 时 甚至 相差 几 个 数量 级 。 所 以 ， 系 统 多 花 一 点 时 间 选 择 一 个 较 好 的 查询 策略 
是 很 值得 的 。 

3. 查询 优化 

查询 优化 是 为 了 查询 选择 最 有 效 的 查询 计划 的 过 程 。 查询 优化 一 方面 是 在 关系 代数 级 进行 
优化 ， 要 做 的 是 力图 找 出 与 给 定 表达 式 等 价 ， 但 执行 效率 更 高 的 一 个 表达 式 。 查 询 优化 的 另 一 
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方面 涉及 查询 语句 处 理 的 详细 策略 的 选择 ， 例 如 选择 执行 运算 所 采用 的 具体 算法 以 及 将 使 用 的 
特定 索引 等 等 。 

一 个 查询 往往 会 有 许多 实现 办 法 ,关键 是 如 何 找 出 一 个 与 之 等 价 的 且 操作 时 间 又 少 的 表达 
式 。 下 面 将 专门 讨论 这 个 问题 。 


7.5.2 ”关系 代数 表达 式 中 的 查询 优化 


关系 系统 的 查询 优化 即 是 关系 数据 库 管理 系统 实现 的 关键 技术 ， 又 是 关系 系统 的 优点 。 
为 ， 用 户 只 要 提出 “干什么 ”， 不 必 指 出 “怎么 干 ”。 

在 关系 代数 表达 式 中 需要 指出 若干 关系 的 操作 步骤 , 问题 是 怎样 做 才能 保证 省 时 、 省 空间 、 
效率 高 ， 这 就 是 查询 优化 的 问题 。 

需要 注意 的 是 ， 在 关系 代数 运算 中 ， 笛 卡 儿 积 、 连 接 运算 最 费时 间 和 空间 ， 究 竟 应 采用 什 
么 样 的 策略 ， 节 省 时 间 空 间 ? 这 就 是 优化 的 准则 。 


1. 优化 的 准则 


优化 的 准则 有 如 下 六 条 。 

(1) 提早 执行 选取 运算 。 对 于 有 选择 运算 的 表达 式 ， 应 优化 成 尽 可 能 先 执行 选择 运算 的 等 
价 表达 式 ， 以 得 到 较 小 的 中 间 结 果 ， 减 少 运算 量 和 从 外 存 读 块 的 次 数 。 

(2) 合并 乘积 与 其 后 的 选择 运算 为 连接 运算 。 在 表达 式 中 , 当 乘 积 运算 后 面 是 选择 运算 时 ， 
应 该 合并 为 连接 运算 ， 使 选择 与 乘积 一 道 完成 ， 以 避免 做 完 乘 积 后 ， 需 再 扫描 一 个 大 的 乘积 关 
系 进行 选择 运算 。 

(3) 将 投影 运算 与 其 后 的 其 他 运算 同时 进行 ， 以 避免 重复 扫描 关系 。 

(4) 将 投影 运算 和 其 前 后 的 二 目 运算 结合 起 来 ， 使 得 没有 必要 为 去 掉 某 些 字 段 再 扫描 一 遍 
关系 。 

(5) 在 执行 连接 前 对 关系 适当 地 预 处 理 ， 就 能 快速 地 找到 要 连接 的 元 组 。 方 法 有 两 种 : 索 
引 连 接 法 、 排 序 合并 连接 法 。 

(6) 存储 公共 子 表 达 式 。 对 于 有 公共 子 表达 式 的 结果 应 存 于 外 存 〈 中 间 结 果 )， 这 样 ， 当 
从 外 存 读 出 它 的 时 间 比 计算 的 时 间 少 时 ， 就 可 节约 操作 时 间 。 


2. 关系 代数 表达 式 的 等 价 变换 规则 
优化 的 策略 均 涉及 关系 代数 表达 式 ， 所 以 讨论 关系 代数 表达 式 的 等 价 变 换 规则 显得 十 分 


要 。 常 用 的 等 价 变换 规则 有 如 下 10 种 。 


(1) 连接 、 笛 卡 儿 积 交换 率 
设 和 EE, 是 关系 代数 表达 式 ，F 是 连接 运算 的 条 件 ， 则 有 : 


a 


集 。 
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EXE,=E,xXE 
Er4E,=E,r4aE, 
F 下 
(2) 连接 、 笛 卡 儿 积 结合 率 
设 El、E,、E 是 关系 代数 表达 式 ，F 、F, 是 连接 运算 的 条 件 ， 则 有 : 
(EXE,)XE,=EX(E,XE,) 
(BEI Pa )P4E3 = 局 ad(E2 p44E;,) 
Fl F2 Fl F2 


(3) 投影 的 串 接 定律 
设 E 是 关系 代数 表达 式 ，4 1,…, 4 和 B,…,B, 是 属性 名 ， 且 B1,…, B,, 是 41,…, 4 的 子 
则 有 : 
TA An TB1,., Bm (E)) Aa... An (E) 
该 规则 的 目的 是 使 一 些 投影 消失 。 
(4) 选择 的 串 接 定律 
设 E 是 关系 代数 表达 式 ，F 、F, 是 选取 条 件 表达 式 ， 选 择 的 串 接 定 律 说 明 选 择 条 件 可 以 


合并 ， 则 有 : 


GFl(GCFaz(E))= ornr2(E) 
(5) 选择 与 投影 的 交换 律 
设 E 是 关系 代数 表达 式 ，F 是 选取 条 件 表达 式 ， 并 且 只 涉及 4 1,…, 4 属性 ， 则 有 : 
OF (Xa,An(E))= 7a. An OF (E)) 
车 亚 中 有 不 属于 4 1,…, 4 属性，B1,…,B,,， 那 么 有 更 一 般 的 规则 : 
OF (AXA,An(E)) = 元 在- 人 OF (TT Al An, Bl Bm (E))) 
该 规则 可 将 投影 分 裂 为 两 个 ， 使 得 其 中 的 一 个 可 能 被 移 到 树 的 叶 端 。 
(6) 选择 与 笛 卡 儿 积 的 交换 律 
若 下 涉及 的 都 是 已 中 的 属性 ， 则 : 
or(B XE,)=or(E)XE, 
如 果 所 = 入 F,，， 并 且 ，F 只 涉及 El 中 的 属性 ，F, 只 涉及 已? 中 的 属性 ， 则 有 : 
Or(B XE,)=on(E)Xor,(E,) 


(7) 选择 与 并 的 交换 律 
设 E= EUE,，El、E, 有 相同 的 属性 ， 则 : 
OF(EIUE,)=or(E)Uor(E,) 


(8) 选择 与 差 的 交换 律 
设 El、E, 有 相同 的 属性 ， 则 : 
OF(El-E)=or(E)-or(E,) 
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(9) 投影 与 笛 卡 儿 积 的 交换 律 
设 El、E, 是 两 个 关系 表达 式 ，4 1,…, 4, 是 El 中 的 属性 ，B,…, B, 是 Es 中 的 属性 ， 则 : 
XA1, An, Bl Bm (Bl XE,)= Xa,.., an(E1l) X Api1, pm(E,) 
(10) 投影 与 并 的 交换 律 
设 Bl、E, 有 相同 的 属性 ， 则 : 
XA An (ElUE2)=AA.., An (ED)UAA,.., an(E2) 


3. 查询 优化 的 算法 


利用 上 述 的 等 价 变换 规则 可 以 对 关系 代数 表达 式 进行 优化 ,使 得 优化 后 的 关系 代数 表达 式 
符合 上 述 的 六 条 基本 优化 的 准则 。 

算法 : 关系 代数 表达 式 的 优化 

输入 : 一 个 关系 代数 表达 式 的 语法 树 

输出 : 计算 该 表达 式 的 程序 

方法 : 

(1) 利用 规则 4 将 形 如 Gel、F2、.Fn(E) 变换 为 : 
Ori(OF2 (GFn (E))...)) 

(2) 对 每 一 个 选择 ， 利 用 规则 4 一 8 尽 可 能 将 它 移 到 树 的 叶 端 。 

(3) 对 每 一 个 投影 ， 利 用 规则 3、9，10，5 中 的 一 般 形式 尽 可 能 将 它 移 到 树 的 叶 端 。 

(4) 利用 规则 3 一 5 将 选择 和 投影 的 串 接合 并 成 单个 选择 、 单 个 投影 或 一 个 选择 后 跟 一 个 
投影 。 使 多 个 选择 或 投影 能 同时 进行 ， 或 在 一 次 扫描 中 全 部 完成 。 

(5) 将 上 述 得 到 的 语法 树 的 内 节点 分 组 。 每 一 双 目 运算 (XxX，U，m，-) 和 它 所 有 的 直 
接 祖 先 为 一 组 〈 这 些 直接 祖先 是 ,zt 运算)。 如 果 其 后 代 直 到 叶子 全 部 是 单 目 运算 ， 则 将 它 并 
入 该 组 。 

(6) 生成 一 个 程序 ， 每 组 节点 的 计算 是 程序 中 的 一 步 。 各 步 的 顺序 是 任意 的 ， 只 要 保证 任 
何 一 组 的 计算 不 会 在 它 的 后 代 组 之 前 计算 。 

【 例 7.14】 供应 商 数据 库 中 有 : 供应 商 S、 零 件 P、 项 目 工 供应 SPJ 四 个 基本 表 (关系 )， 
其 关系 模式 如 下 所 示 。 

S(Sno,Sname,Status,City) 

P(Pno,Pname,Color, Weight) 

J(Jno,Jname,City) 

SPJ(Sno,Pno,Jno,Qty) 

车 用 户 要 求 查 询 使 用 “上 海 ” 供 应 商 生产 的 “红色 ”零件 的 工程 号 ， 请 解答 如 下 问题 : 

(1) 试 写 出 该 查询 的 关系 代数 表达 式 ; 

(2) 试 写 出 查询 优化 的 关系 代数 表达 式 ; 
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(3) 画 出 该 查询 初始 的 关系 代数 表达 式 的 语法 树 ; 

(4) 使 用 优化 算法 ， 对 语法 树 进 行 优化 ， 并 画 出 优化 后 的 语法 树 。 

解 : 

(1) 使 用 “上 海 ” 供 应 商 生 产 的 “红色 ”零件 的 工程 号 的 关系 代数 表达 式 如 下 : 
Tyno (Gowy= En color=r, GeaSPJeap)) 

(2) 对 (1) 优化 后 的 关系 代数 表达 式 如 下 : 

rjno (rsno (Oo Ctiy=' 上 海 1 人 G))pa rs poo, soo (SPJ) Pa rpoo (Gcoror=ar(P) 

(3) 初始 的 关系 代数 表达 式 (1) 的 语法 树 如 图 7-24 所 示 。 

(4) 对 图 7-24 语法 树 进行 优化 ， 优 化 后 的 语法 树 如 图 7-25 所 示 。 


Tno Tjno 
Gcity=' 上 海 '^ Color=' 红 " Gspj pno-PPno 
Tio Sname Status.City Pnojno.QYy, Pname Color Weight p> * Se 
年 | Tsoo Po Jno Tpno 
S.Sno=SPJ. Sno 人 SPJ Pno=PPno [| 可 1 
| Ss sa Sno colo 
x Pp 
LA / ASS 
S -xs Tsno Tsoo ,Pao jno 
| 
SPJ P o cur SPJ 
S 
图 7-24 优化 前 7-25 ”优化 后 


7.6 关系 数据 库 设计 基础 理论 


在 关系 模型 中 ， 一 个 数据 库 模式 是 关系 模式 的 集合 。 关 系数 据 理 论 是 指导 数据 库 设 计 的 基 
础 ， 关 系数 据 库 设 计 是 数据 库 语 义学 的 问题 。 要 保证 构造 的 关系 既 能 准确 地 反应 现实 世界 ， 又 
有 利于 应 用 和 具体 的 操作 。 关 系数 据 库 设计 理论 的 核心 是 数据 间 的 函数 依赖 ， 衡 量 的 标准 是 关 
系 规范 化 的 程度 及 分 解 的 无 损 连 接 和 保持 函数 依赖 性 。 关 系数 据 库 设计 的 目标 是 生成 一 组 合适 
的 、 性 能 良好 的 关系 模式 ， 以 减少 系统 中 信息 存储 的 元 余 度 ， 但 又 可 方便 地 获取 信息 。 


7.6.1 基础 知识 
数据 依赖 是 通过 一 个 关系 中 属性 间 值 的 相等 与 否 体现 出 来 的 数据 间 的 相互 关系 ,是 现实 世 
要 


界 属 性 间 联 系 和 约束 的 抽象 ， 是 数据 内 在 的 性 质 ， 是 语义 的 体现 。 函 数 依赖 则 是 一 种 最 重要 、 
最 基本 的 数据 依赖 。 
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1. 函数 依赖 


【定义 7.4】 设 R(D) 是 属性 集 U 上 的 关系 模式 , X、Y 是 UU 的 子 集 。 若 对 R(U) 的 任何 一 个 
可 能 的 关系 " r 中 不 可 能 存在 两 个 元 组 在 X 上 的 属性 值 相等 , 而 在 Y 上 的 属性 值 不 等 , 则 称 X 
函数 决定 Y 或 Y 函数 依赖 于 X， 记 作 : XY。 

。 如 果 X-*Y， 但 YEX， 则 称 X-*Y 是 非 平 凡 的 函数 依赖 。 一 般 情况 下 总 是 讨论 非 平 凡 

的 函数 依赖 。 

。 如 果 X 一 Y,， 但 YSX， 则 称 XY 是 平凡 的 函数 依赖 。 

注意 : 函数 依赖 XY 的 定义 要 求 关系 模式 R 的 任何 可 能 的 r 都 满足 上 述 条 件 。 因 此 不 能 
仅 考 察 关 系 模式 R 在 某 一 时 刻 的 关系 r， 就 断定 某 函 数 依赖 成 立 。 

例如 ， 关 系 模式 Student(Sno,Sname,SD,Sage,Sex) 可 能 在 某 一 时 刻 ，Student 的 关系 了 中 每 个 
学 生 的 年 龄 都 不 同 ， 也 就 是 说 没有 两 个 元 组 在 Sage 属性 上 取 值 相同 ， 而 在 Sno 属性 上 取 值 不 
同 ， 但 我 们 决 不 可 据 此 就 断定 Sage 一 Sno。 很 有 可 能 在 某 一 时 刻 ，Student 的 关系 r 中 有 两 个 元 
组 在 Sage 属性 上 取 值 相同 ， 而 在 Sno 属性 上 取 值 不 同 。 
函数 依赖 是 语义 范畴 的 概念 ， 我 们 只 能 根据 语义 来 确定 函数 依赖 。 例 如 ， 在 没有 同名 的 情 
况 下 ，Sname 一 Sage， 而 在 允许 同名 的 情况 下 ， 这 个 函数 依赖 就 不 成 立 了 。 

【定义 7.5】 在 R(D) 中 ， 如果 XY， 并且 对 于 XX 的 任何 一 个 真子 集 X'， 都 有 X' 不 能 决 
定 Y， 则 称 立 对 X 完 全 函数 依赖 ， 记 作 : XY 。 如 果 X-*Y， 但 Y 不 完全 函数 依赖 于 X， 则 


称 Y 对 X 部 分 函数 依赖 ， 记 作 : X_>Y 。 部 分 函数 依赖 也 称 局 部 函数 依赖 。 

例如 : 给 定 一 个 学 生 选 课 关 系 SC(Sno,Cno,G)， 我 们 可 以 得 到 F={(Sno,Cno) 一 G }， 对 
(Sno,Cno) 中 的 任何 一 个 真子 集 Sno 或 Cno 都 不 能 决定 G， 所 以 ，G 完全 依赖 于 Sno，Cno。 

【定义 7.6】 在 R(U,F) 中 ， 如 果 X>Y，Y#¥X，Y+*X，Y 一 Z， 则 称 Z 对 XX 传递 依赖 。 

【 例 7.15】 关系 供应 商 (Sno,Sname,Status,CityPno,Qty)， 及 函数 依赖 集 如 下 ， 判 断 该 关系 
是 否 存在 传递 依赖 和 部 分 函数 依赖 。 

F={ Sno 一 Sname,Sno 一 Status,Status 一 City,(Sno,Pno) 一 Qty} 

解 : 存在 函数 依赖 。 因为 根据 题 意 Sno 一 Status，Status 一 City, 且 Status 4 Sno, Status*Sno， 
故 Sno 一 City， 即 City 对 Sno 传递 依赖 。 

存在 部 分 函数 依赖 。 因 为 根据 题 意 (Sno,Pno) 一 (Sname,Status,City), 但 Sno 一 (Sname,Status,City)， 
故 关系 供应 商 存在 Sname、Status 和 City 对 (Sno,Pno) 的 部 分 函数 依赖 。 


2. 码 


【定义 7.7】 设 K 为 R(U,F) 中 的 属性 的 组 合 ， 若 K 一 U， 且 对 于 K 的 任何 一 个 真子 集 K' ， 


第 7 章 关系 数据 库 “ 国 345 荐 


都 有 KK 不 能 决定 U， 则 K 为 R 的 候选 码 〈Candidata Key)， 若 有 多 个 候选 码 ， 则 选 一 个 作为 
主 码 (Primary Key)。 

注意 : 候选 码 通常 也 可 以 称 为 候选 关键 字 ， 主 码 通常 也 可 以 称 为 主 关键 字 或 主键 。 包 含 在 
任何 一 个 候选 码 中 的 属性 叫做 主 属 性 (Prime Attribute), 否则 叫做 非 主 属性 (Nonprime Attribute) 
或 非 码 属性 (Non-key Attribute)。 最 简单 的 情况 ， 关 系 的 单个 属性 是 码 ;， 最 极端 的 情况 ， 关 系 
的 所 有 属性 为 码 ， 该 码 称 为 全 码 (All-key)。 

包含 在 任何 一 个 候选 码 中 的 属性 叫做 主 属性 (Prime Attribute)， 否 则 叫做 非 主 属性 
(Nonprime Attribute)。 

例如 ， 关 系 模式 CSZ(CITY，ST，ZIP)， 其 属性 组 上 的 函数 依赖 集 为 

F={(CITY,ST)—ZIP, ZIP—>CITY} 

即 城市 、 街 道 决定 邮政 编码 ， 邮 政 编码 决定 城市 。 不 难看 出 ， (CITY，ST) 和 (ST，ZIP) 都 为 
候选 码 ， 因 为 它们 可 以 决定 关系 模式 CSZ 的 全 属性 ， 且 属性 CITY、ST、ZIP 都 是 主 属性 。 

【定义 7.8】 若 R(U) 中 的 属性 或 属性 组 和 X 非 及 的 码 ， 但 X 是 另 一 个 关系 的 码 ， 则 称 和 是 及 
的 外 码 (Foreign Key) 或 称 外 键 。 

例如 在 员工 《员工 号 ， 姓 名 ， 部 门 号 ， 职 位 ， 联 系 方式 ) 中 ， 部 门 号 不 是 码 ， 但 部 门 号 是 关 
系 部 门 〈 部 门 号 ， 部 门 名 ， 负 责 人 ) 的 码 ， 则 部 门 号 是 关系 员工 的 外 码 。 

需要 说 明 的 是 ， 主 码 与 外 码 提供 了 关系 间 联 系 的 方法 ， 例如， 查询 某 员 工 属于 哪个 部 门 的 部 
门 名 ， 则 可 通过 关系 员工 的 外 码 “ 部 门 号 ”建立 与 关系 部 门 的 联系 ， 找 到 所 属 的 部 门 名 。 


3. 多 值 依赖 


【定义 7.9】 若 关系 模式 R (U) 中 ，X、Y、Z 是 U 的 子 集 ， 并 且 Z=U-X-Y。 当 且 仅 当 对 
R〈U) 的 任何 一 个 关系 r， 给 定 一 对 (xz) 值 ， 有 一 组 Y 的 值 ， 这 组 值 仅仅 决定 于 x 值 而 与 z 值 
无 关 ， 则 称 “Y 多 值 依赖 于 X” 或 “X 多 值 决定 Y” 成 立 。 记 为 : XY。 

多 值 依赖 具有 如 下 六 条 性 质 : 

。 多 值 依 赖 具有 对 称 性 。 即 若 X 一 一 Y， 则 X 一 一 Z， 其 中 Z=U-X-Y。 

e。 多 值 依 赖 的 传递 性 。 即 若 X 一 一 Y，Y 一 一 Z， 则 X 一 一 Z-Y。 

。 函数 依赖 可 以 看 成 是 多 值 依赖 的 特殊 情况 。 

。 若 X 一 一 Y，X 一 一 2Z， 则 X 一 一 YZ。 

”车 X 一 一 Y，X 一 一 Z， 则 X 一 一 YnZ。 

。 车 X- 一 Y，X-, 一 Z， 则 X 一 一 :Z-Y。 
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7.6.2 规范 化 


关系 数据 库 设计 的 方法 之 一 就 是 设计 满足 适当 范式 的 模式 , 通常 可 以 通过 判断 分 解 后 的 模 
式 达 到 几 范 式 来 评价 模式 规范 化 的 程度 。 范 式 有 : 1NF、2NF、3NF、BCNF、4NF 和 5NF， 
中 1NF 级 别 最 低 。 这 几 种 范式 之 间 INF 二 2NF 二 3NF 二 BCNF 二 4NF 二 SNF 成 立 。 

通过 分 解 ， 可 以 将 一 个 低 一 级 范式 的 关系 模式 转换 成 若干 个 高 一 级 范式 的 关系 模式 ， 这 种 
过 程 叫 做 规范 化 。 下 面 将 给 出 各 个 范式 的 定义 。 


1. 1NF〈 第 一 范式 ) 


【定义 7.10】 若 关系 模式 R 的 每 一 个 分 量 是 不 可 再 分 的 数据 项 ， 则 关系 模式 R 属于 第 一 
范式 。 记 为 RE 1NF。 

例如 ， 供 应 者 和 它 所 提供 的 零件 信息 ， 关 系 模式 FIRST 和 函数 依赖 集 F 如 下 : 

FIRST(Sno,Sname,Status,City,Pno,Qty) 

F={ Sno 一 Sname,Sno 一 Status,Status 一 City,(Sno,Pno) 一 Qty} 

对 具体 的 关系 FIRST 如 表 7-2 所 示 。 从 表 7-2 中 可 表 7-2 FIRST 
以 看 出 ， 每 一 个 分 量 都 是 不 可 再 分 的 数据 项 ， 所 以 是 ne mere feats cns | Psp ow 
1NF 的 。 但 是 ，1NF 存在 如 下 四 个 问题 。 

(1) 宛 余 度 大 。 例 如 每 个 供应 者 的 Sno、Sname、 
Status、City 要 与 其 供应 的 零件 的 种 类 一 样 多 。 

(2) 引起 修改 操作 的 不 一 致 性 。 例 如 供应 者 S1 从 
“天 津 ” 搬 到 “上 海 ”, 若 不 注意 , 会 使 一 些 数据 被 修改 ， 
另 一 些 数据 未 被 修改 ， 导 致 数据 修改 的 不 一 致 性 。 

(3) 插入 异常 。 关 系 模式 FRIST 的 主 码 为 Sno、 
Pno， 按 照 关系 模式 实体 完整 性 规定 主 码 不 能 取 空 值 或 部 分 取 空 值 。 这 样 ， 当 某 个 供应 者 的 某 
些 信息 未 提供 时 〈 如 Pno)， 则 不 能 进行 插入 操作 ， 这 就 是 所 谓 的 插入 异常 。 

(4) 删除 异常 。 若 供应 商 S4 的 P2 零件 销售 完了 ， 并 且 以 后 不 再 销售 P2 零件 ， 那 么 应 删 
除 该 元 组 。 这 样 ， 在 基本 关系 FIRST 找 不 到 S4， 可 S4 又 是 客观 存在 的 。 

正 因为 上 述 四 个 原因 ， 所 以 要 对 模式 进行 分 解 ， 并 引入 了 2NF。 


2. 2NF〈 第 二 范式 ) 


【定义 7.11】 若 关系 模式 RE 1NF, 且 每 一 个 非 主 属性 完全 依赖 于 码 , 则 关系 模式 RE 2NF。 
换 句 话说 ， 当 1NF 消除 了 非 主 属性 对 码 的 部 分 函数 依赖 ， 则 称 为 2NF。 
例如 : FIRST 关系 中 的 码 是 Sno、Pno， 而 Sno 一 Status， 因 此 非 主 属性 Status 部 分 函数 依 
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赖 于 码 ， 故 非 2NF 的 。 

若 此 时 ， 将 FIRST 关系 分 解 为 : 

FIRSTI(Sno,Sname,Status,City) € 2NF 

FIRST2(Sno,Pno,Qty) E 2NF 
因为 分 解 后 的 关系 模式 FIRST 的 码 为 Sno， 非 主 属性 Sname、Status、City 完全 依赖 于 码 
Sno， 所 以 属于 2NF; 关系 模式 FIRST, 的 码 为 Sno、Pno， 非 主 属性 Qty 完全 依赖 于 码 ， 所 以 也 
属于 2NF。 


3. 3NF (第 三 范式 ) 


【定义 7.12】 若 关系 模式 R(U,F) 中 若 不 存在 这 样 的 码 X， 属 性 组 Y 及 非 主 属性 ZCZ&Y) 使 
得 X 一 Y，(Y+*X)Y 一 Z 成 立 ， 则 关系 模式 RE 3NF。 

即 当 2NF 消除 了 非 主 属性 对 码 的 传递 函数 依赖 ， 则 称 为 3NF。 

例如 : FIRST1g3NF， 因 为 在 分 解 后 的 关系 模式 FIRST 中 有 Sno 一 Status,Status 一 City， 存 
在 着 非 主 属性 City 传递 依赖 于 码 Sno。 若 此 时 将 FIRST, 继续 分 解 为 : 

FIRSTI(Sno,Sname,Status) € 3NF 

FIRST1,(Status,City) € 3NF 

通过 上 述 分 解 ,数据 库 模 式 FIRST 转 换 为 FIRSTII(Sno,Sname,Status)，FIRST12(Status,City)， 
FIRST(Sno,Pno,Qty) 三 个 子 模式 。 由 于 这 三 个 子 模式 都 达到 了 3NF， 因 此 称 分 解 后 的 数据 库 模 
式 达 到 了 3NF。 

可 以 证 明 , 3NF 的 模式 必 是 2NF 的 模式 。 产生 元 余 和 异常 的 两 个 重要 原因 是 部 分 依赖 和 传 
递 依 赖 。 因为 3NF 模式 中 不 存在 非 主 属性 对 码 的 部 分 函数 依赖 和 传递 函数 依赖 ， 所 以 具有 较 好 
的 性 能 。 对 于 非 3NF 的 INF、2NF 其 性 能 弱 ， 一 般 不 宜 作为 数据 库 模式 ， 通 常 要 将 它们 变换 成 
为 3NF 或 更 高 级 别 的 范式 ， 这 种 变换 过 程 称 为 “关系 模式 的 规范 化 处 理 ”。 


4. BCNF (Boyce Codd Normal Form， 巴 克 斯 范式 ) 


【定义 7.13】 关 系 模式 RE 1NF, 若 XY 有 晶 Y¢X 时 ,X 必 含有 码 , 则 关系 模式 RE BCNF。 

也 就 是 说 ， 当 3NF 消除 了 主 属性 对 码 的 部 分 函数 依赖 和 传递 函数 依赖 ， 则 称 为 BCNF。 

结论 : 一 个 满足 BCNF 的 关系 模式 ， 应 有 如 下 性 质 : 

(1) 所 有 非 主 属性 对 每 一 个 码 都 是 完全 函数 依赖 ; 

(2) 所 有 非 主 属性 对 每 一 个 不 包含 它 的 码 ， 也 是 完全 函数 依赖 ; 

(3) 没有 任何 属性 完全 函数 依赖 于 非 码 的 任何 一 组 属性 。 

例如 ， 设 R (Pno，Pname，Mname) 的 属性 分 别 表示 零件 号 、 零 件 名 和 厂商 名 ， 如 果 约 定 ， 
每 种 零件 号 只 有 一 个 零件 名 ， 但 不 同 的 零件 号 可 以 有 相同 的 零件 名 ; 每 种 零件 可 以 有 多 个 厂商 
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生产 ， 但 每 家 厂商 生产 的 零件 应 有 不 同 的 零件 名 。 这 样 我 们 可 以 得 到 如 下 一 组 函数 依赖 : 
Pno—Pname,(Pname,Mname)—Pno 
由 于 该 关系 模式 R 中 的 候选 码 为 (Pname,Mname) 或 (Pno,Mname)， 因 而 关系 模式 R 的 
属性 都 是 主 属性 ， 不 存在 非 主 属性 对 码 的 传递 依赖 ， 所 以 R 是 3NF 的 。 但是， 主 属性 Pname 
传递 依赖 于 码 〈(Pname,Mname)， 因 此 R 不 是 BCNF 的 。 当 一 种 零件 由 多 个 生产 厂家 生产 时 ， 
零件 名 与 零件 号 间 的 联系 将 多 次 重复 ， 带 来 元 余 和 操作 异常 现象 。 若 将 R 分 解 成 : 
R1(Pno,Pname) 和 R2(Pno,Mname) 
就 可 以 解决 上 述 问题 ， 并 且 分 解 后 的 关系 模式 R1、R2 都 属于 BCNF。 


5. 4NF (第 四 范式 ) 


【定义 7.14】 关系 模式 RE 1INF， 若 对 于 R 的 每 个 非 平凡 多 值 依赖 X 一 一 Y 且 Y¥X 时 ， 
X 必 含 有 码 ， 则 关系 模式 R(U,F) € 4NF。 

4NF 是 限制 关系 模式 的 属性 间 不 允许 有 非 平凡 且 非 函数 依赖 的 多 值 依 赖 。 

注意 : 如 果 只 考虑 函数 依赖 ， 关 系 模式 最 高 的 规范 化 程度 是 BCNF; 如 果 考 虑 多 值 依赖 ， 
关系 模式 最 高 的 规范 化 程度 是 4NF。 


6. 连接 依赖 SNF 


连接 依赖 : 当 关 系 模式 无 损 分 解 为 n 个 投影 (n>2) 会 产生 一 些 特殊 的 情况 。 下 面 考虑 供应 
商 数据 库 中 SPJ 关系 的 一 个 具体 的 值 ， 如 图 7-26 所 示 。 
SPJ SP 


PJ SJ 
Sno Pno | Jno Sno | Pno Pno Jno Sno Jno 
S1 P1 卫 Sl | P1 P1 了 2 Sl 了 
Sl P2 1 Sl |P2 P2 J1 Sl 1 
S2 Pl 本 S2 | P1 P1 1 S2 本 
Sl P1 如 
SPpa P7 SPPAPJPASJ 
| | 
Sno 原始 的 SPJ 
Sl 
Sl 
S2 
S2 
sl 


图 7-26 关系 SPJ 是 三 个 二 元 投影 的 连接 
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第 一 次 SP、PJ 投影 连接 “SP ea PJ ”起 来 的 结果 比 原始 SPJ 关系 多 了 一 个 元 组 “S2，P1， 
卫 ” 如 图 7-26 中 带 下 画 线 的 元 组 。 第 二 次 连接 的 结果 去 掉 了 多 余 的 元 组 ， 从 而 恢复 了 原始 的 
关系 SPJ。 在 这 种 情况 下 ， 原 始 的 SPJ 关系 是 可 3 分 解 的 。 注 意 ， 无 论 我 们 选择 哪 两 个 投影 作 
为 第 一 次 连接 ， 结 果 都 是 一 样 的 ， 尽 管 在 每 种 情况 下 中 间 结 果 不 同 。 

SPJ 的 可 3 分 解 性 是 基本 与 时 间 无 关 的 特性 ， 是 关系 模式 的 所 有 合法 值 满足 的 特性 ， 也 就 
是 说 , 这 是 关系 模式 满足 一 个 特定 的 与 时 间 无 关 的 完整 性 约束 。 将 这 种 约束 简称 为 3D (3 分 解 ) 
约束 。 上 述 情况 就 是 连接 依赖 要 研究 的 问题 。 

连接 依赖 : 如 果 给 定 一 个 关系 模式 R,R1,Ro,R3,…,Rs 是 R 的 分 解 ， 那 么 称 R 满足 连接 依赖 
JD7{RUR2R3…,Ra}j， 当 且 仅 当 R 的 任何 可 能 出 现 的 合法 值 都 与 它 在 Ri,R2,R3…,Rs 上 的 投影 


形式 化 地 说 , 车 R=RIURsU……UR。， 且 r=TIR,D>4TIR,OP4…PaTIR,， 则 称 RR 


满足 连接 依赖 JD"{R1,R2,R3,…,Rs}。 如 果 某 个 Ri 就 是 R 本 身 ， 则 连接 依赖 是 平凡 的 。 

为 了 进一步 理解 连接 依赖 的 概念 ， 我 们 考虑 银行 数据 库 中 的 子 模式 : 贷款 
(L-no,Bname,C-name,amount)， 其 中 : 

。 ”贷款 号 为 L-no 的 贷款 是 由 机 构 名 为 Bname 贷 出 的 。 

。 ”贷款 号 为 L-no 的 贷款 是 贷 给 客户 名 为 C-name 的 客户 。 

。 ”贷款 号 为 L-no 的 贷款 的 金额 是 amount。 

我 们 可 以 看 到 这 是 一 个 非常 直观 的 逻辑 蕴涵 连接 依赖 : 

JD'((L-no,Bname),(L-no,C-name),(L-no,amount)) 

这 个 例子 说 明了 连接 依赖 很 直观 ， 符 合 数据 库 设 计 的 原则 。 

【定义 7.15】 一 个 关系 模式 R 是 第 五 范式 (也 称 投影 -连接 范式 PJINF)， 当 且 仅 当 R 的 每 
一 个 非 平凡 的 连接 依赖 都 被 R 的 候选 码 所 蕴涵 。 记 作 5NF。 

“被 R 的 候选 码 所 蕴涵 ”的 含义 可 通过 SPJ 关系 来 理解 。 关 系 模式 SPJ 并 不 是 SNF 的 ， 因 
为 它 满足 一 个 特定 连接 依赖 ， 即 3D 约束 。 这 显然 没有 被 其 唯一 的 候选 码 〈 该 候选 码 是 所 有 属 
性 的 组 合 ) 所 蕴涵 。 其 区 别 是， 关系 模式 SPJ 并 不 是 SNF， 因 为 它 是 可 被 3 分 解 的 ， 可 3 分 解 
并 没有 为 其 (Sno,Pno,Jno) 后 选 码 所 蕴涵 。 但 是 将 SPJ 3 分 解 后 ， 由 于 3 个 投影 SP、PJ、JS 不 
包括 任何 《〈 非 平凡 的 ) 连接 依赖 ， 因 此 它们 都 是 SNF 的 。 

【 例 7.16】 设 有 关系 模式 R( 课 程 ， 教 师 ， 学 生 ， 成 绩 ， 时 间 ， 教 室 )， 其 中 函数 依赖 
集 F 如 下 : 

F== {课程 一 一 教师 ，( 学 生 ， 课 程 ) 一 成 绩 ，( 时 间 ， 教 室 ) 一 课程 ， 
(时 间 ， 教 师 ) 一 教室 ，( 时 间 ， 学 生 ) 一 教室 } 

关系 模式 R 的 一 个 主键 是 _(1) _，R 规范 化 程度 最 高 达到 _〈2〉_。 若 将 关系 模式 R 

分 解 为 3 个 关系 模式 R1 (课程 ， 教 师 )、R2 (学生, 课程 ,成绩 )、R3 (学 生 ， 时 间 ， 教 室 ， 
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课程 )， 其 中 R2 的 规范 化 程度 最 高 达到 3》 


(1) A.〈 学 生 ， 课 程 ) B.〈 时 间 ， 教 室 ) 

C.〔 时 间 ， 教 师 ) D.〈 时 间 ， 学 生 ) 
(2) A. INF B. 2NF C. 3NF D. BCNF 
(3) A. 2NF B. 3NF C. BCNF D. 4NF 


例题 (1) 一 (3) 分 析 

(1) 的 正确 答案 为 D。 因 为 根据 函数 依赖 集 F 可 知 〈 时 间 ， 学 生 ) 可 以 决定 关系 及 中 的 全 
部 属性 ， 故 关系 模式 R 的 一 个 主键 是 〈 时 间 ， 学 生 )。 

(2) 的 正确 答案 为 B。 因 为 根据 函数 依赖 集 F 可 知 ，R 中 的 每 个 非 主 属 性 完全 函数 依赖 
于 (时 间 ， 学 生 )， 所 以 R 是 2NF。 

(3) 的 正确 答案 为 C。 因 为 R2〈 学 生 ， 课 程 ， 成 绩 ) 的 主键 为 学生， 课程 )， 而 R2 
的 每 个 属性 都 不 传递 依赖 于 R2 的 任何 键 ， 所 以 R2 是 BCNF。 


7.6.3 ”Armstrong 公理 系统 


1，Armstrong 公理 系统 


Armstrong 公理 系统 (或 称 函数 依赖 的 公理 系统 ): 设 关系 模式 R(U,F), 其 中 U 为 属性 集 ， 
F 是 U 上 的 一 组 函数 依赖 ,那么 有 如 下 推理 规则 : 

(1) Al 自 反 律 : 车 YSsXsU， 则 XY 为 F 所 蕴涵 。 

(2) A2 增 广 律 : 车 XY 为 F 所 比 涵 ， 且 ZsU， 则 XZYZ 为 了 所 蕴涵 。 

(3) A3 传递 律 ， 若 XY，Y 一 Z 为 了 所 列 涵 ， 则 XZ 为 所 蕴涵 。 

根据 上 述 三 条 推理 规则 又 可 推出 下 述 三 条 推理 规则 : 

(1) 合并 规则 ; 若 XY，X 一 Z， 则 X 一 YZ 为 F 所 蕴涵 。 

(2) 伪 传 递 率 : 车 XY，WY 一 Z， 则 XW 一 Z 为 所 蕴涵 。 

(3) 分 解 规则 : 车 X 一 Y，ZSY， 则 XZ 为 F 所 蕴涵 。 

引 理 : X 一 Al A2.… Arx 成 立 的 充分 必要 的 条 件 是 XAi; 成 立 (i=1,2,3...k)。 证 明 略 。 


2， 函数 依 赖 的 闭 包 F* 及 属性 的 闭 包 XX 


(1) 函数 依赖 的 闭 包 F* 

【定义 7.16】 关系 模式 R(U,F) 中 为 F 所 逻辑 蕴含 的 函数 依赖 的 全 体 称 为 F 的 闭 包 ， 记 
为 : F+ 。 
(2) 属性 的 闭 包 XX: 
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【定义 7.17】 设 下 为 属性 集 U 上 的 一 组 函数 依赖 ，XcU，Xi={A| X 一 A 能 由 下 根据 
Armstrong 公理 导出 }， 则 称 Xi 为 属性 集 义 关于 函数 依赖 集 F 的 闭 包 。 


算法 : 求 属性 的 闭 包 Xt 。 
输入 : X,F 

输出 : XX: 

步骤 : 

© 令 XO =X, 0 


@ 求 B, B={Al(3V)(3w)(V WEFANVEX® 和 AEW)} 


@®@ XV=BUX® 
@ XV =X ? 


@ 若 相等 ， 或 XO-U， 则 X9 为 属性 集 X 关于 函数 依赖 集 F 的 闭 包 。 且 算法 终止 。 
@ 若 不 相等 ， 则 =i+1， 返 回 @。 
【 例 7.17】 己 知 关系 模式 R(U,F)，U={A, B,C, D, E}; 


F={A—B, D»C, BCOE, 
求 (AE)t 、(ADJF 。 
解 


AC—B} 


Q@ 求 (AE): ， 根 据 上 述 算法 ， 设 XO-AE 


。 计算 XW 。 逐 一 扫描 F 中 的 各 个 函数 依赖 ， 找 到 左 部 为 A、E 或 AE 的 函数 依赖 ， 找 


到 一 个 A 一 B。 故 有 Xm 
。 计算 XW? 。 逐 一 扫描 F 


=AEUB。 
FP 的 各 个 函数 依赖 , 找到 左 部 为 ABE 或 ABE 子 集 的 函数 依赖 ， 


因为 找 不 到 这 样 的 函数 依赖 ， 所 以 ，X = XCO。 算 法 终止 ，(AE)f = ABE 。 


@ 求 (AD)F ， 由 上 述 算法 ， 


设 XO=AD 


。 计算 XW : 逐一 扫描 F 中 的 各 个 函数 依赖 ， 找 到 左 部 为 A、D 或 AD 的 函数 依赖 ， 找 
到 两 个 : A 一 B，D 一 C 函数 依赖 。 故 有 X=ADUBC。 


。 计算 X® : 逐一 扫描 下 
依赖 , 得 到 两 个 : BC 一 E 


中 的 各 个 函数 依赖 ， 找 到 左 部 为 ADBC 或 ADBC 子 集 的 函数 
, AC 一 B 函数 依赖 , 故 有 X® =ABCDUE。 由 于 XC = ABCDE= 


U， 算 法 终止 。 所 以 (AD)i = ABCDE 。 


3， 候 选 码 的 求解 方法 


给 定 一 个 关系 模式 RU，F)， 
分 为 如 下 四 类 : 


U={A1,A2,…,An},， F 是 R 的 函数 依赖 集 ， 那么 ,可 以 将 属性 


。 工 : 仅 出 现在 函数 依赖 集 F 左 部 的 属性 
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。 R: 仅 出 现在 函数 依赖 集 下 右 部 的 属性 

。 LR: 在 函数 依赖 集 F 左右 部 都 出 现 的 属性 

。 NLR: 在 函数 依赖 集 F 左右 部 都 未 出 现 的 属性 

根据 候选 码 的 特性 ， 对 于 给 定 一 个 关系 模式 R(U,F)， 可 以 得 出 如 下 结论 : 

结论 1: 若 XCXSU) 是 工 类 属性 ， 则 X 必 为 R 的 任 一 候选 码 的 成 员 。 若 Xt=U， 则 X 必 为 
R 的 唯一 候选 码 。 

结论 2: 若 XCXSU) 是 R 类 属性 ， 则 和 X 不 是 R 的 任 一 候选 码 的 成 员 。 

结论 3: 若 XCXSU) 是 NLR 类 属性 ， 则 X 必 为 R 的 任 一 候选 码 的 成 员 。 

结论 4: 车 X(XSU) 是 类 和 NLR 类 属性 组 成 的 属性 集 ， 若 Xz=U， 则 X 必 为 R 的 唯一 
候选 码 。 

【 例 7.18】 设 关系 模式 R(U,F)， 其 中 ，U=(A,B,C,D)，F={ A 一 C,C 一 B,AD 一 B }。 求 有 的 
候选 码 。 

解 : 根据 结论 1 可 以 求 得 R 的 候选 码 为 AD， 而且 AD 是 R 唯一 的 候选 码 。 分 析 如 下 : 

(1) 检查 函数 依赖 集 F 发 现 ，A、D 只 出 现在 函数 依赖 的 左 部 ， 所 以 为 工 类 属性 ， 而 F 包 
含 了 全 属性 ， 既 不 存在 NLR 类 的 属性 ; 

(2) 根据 求 属性 闭 包 的 算法 ，F 中 A 一 C、AD 一 B 可 以 求 得 (AD 站 =ABCD=U， 而 在 AD 
中 不 存在 一 个 真子 集 能 决定 全 属性 ， 故 AD 为 R 的 候选 码 。 

【 例 7.19】 设 关系 模式 RU,F)， 其 中 ,，U=(HLLJK,LM), F={ HLK LLM KIKKH M})。 求 
R 的 候选 码 。 

解 : 根据 结论 1 一 结论 4 可 以 求 得 R 的 候选 码 为 HLJ, 而 且 HLJ 是 RR 唯一 的 候选 码 。 现 分 
析 如 下 : 

(1) 检查 函数 依赖 集 F 发 现 ，H、L 只 出 现在 函数 依赖 的 左 部 ， 所 以 为 类 属性 。 由 于 J 在 
F 中 的 左右 部 均 未 出 现 ， 所 以 J 为 NLR 类 的 属性 。 

(2) 根据 求 属性 闭 包 的 算法 , F 中 HI、IsK、KH 一 M 可 以 求 得 (HLDt =HIJKLM=U， 
而 在 HLJ 中 不 存在 一 个 真子 集 能 决定 全 属性 ， 故 HLJ 为 R 的 候选 码 。 


4. 最 小 函数 依赖 集 


【定义 7.18】 如 果 函 数 依 赖 集 五 满足 下 列 条 件 ， 则 称 为 一 个 最 小 函数 依赖 集 ， 或 称 极 小 
函数 依赖 集 或 最 小 覆盖 。 

(1) 中 的 任 一 函数 依赖 的 右 部 仅 有 一 个 属性 ， 即 无 多 余 的 属性 ; 

(2) 五 中 不 存在 这 样 的 函数 依赖 XA， 使 得 F 与 F-{X 一 4} 等 价 , 即 无 多 余 的 函数 依赖 ; 

(3) 五 中 不 存在 这 样 的 函数 依赖 XA4， 革 有 真子 集 2Z 使 得 F 与 F-{X 一 A}U {2 一 4} 等 
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价 ， 即 去 掉 各 函数 依赖 左边 的 多 余 属 性 。 
7.6.4 模式 分 解 及 分 解 后 的 特性 


1. 分 解 


【定义 7.19】 关系 模式 RU 已 的 一 个 分 解 p 是 指 p= {RI(U1,F),R(U2,Fy)…,R,(U,F,)}， 
其 中 : U= 山 U，， 并 且 没 有 US U1<i, j<n, Fi 是 F 在 U; 上 的 投影 , F={XYXE YE F+ 
i=] 
AXYS Ui}。 
对 一 个 给 定 的 模式 进行 分 解 ， 使 得 分 解 后 的 模式 是 否 与 原来 的 模式 等 价 有 三 种 情况 : 
(1) 分 解 具 有 无 损 连 接 性 ; 


(2) 分 解 要 保持 函数 依赖 ; 
(3) 分 解 既 要 无 损 连 接 性 ， 又 要 保持 函数 依赖 。 


2， 无损 连接 
【定义 7.20】p = {ROR),Rs(U2,F)…,Ri(Ui,FRi)} 是 关系 模式 R(U,F) 的 一 个 分 解 ， 若 对 
R(U,) 的 任何 一 个 关系 + 均 有 x=m,(r2) 成立， 则 成 分 解 p 具有 无 损 连接 性 ， 简 称 无 损 分 解 。 其 


大 
中 ，mp 人 7 =Pqdrni0r7 。 
i=l 


【定理 7.1】 关系 模式 R(U,) 的 一 个 分 解 p = {RI(UV1,Ri),Rs(U2,F 族 ， 上 共有 无 损 连 接 的 充分 
必要 的 条 件 是 :nza 一 Ui-U,eF! 或 UV, 一 U,-UieF*+。 证 明 略 。 

【 例 7.20】 对 给 定 的 关系 模式 R(U,F)，U ={4,B,C} ，F={4 一 B}， 有 两 个 分 解 : 
pi ={4B,BC} 和 p, ={4B,4C} 。 请 判断 这 两 个 分 解 是 否 无 损 。 

解 : 可 根据 无 损 连 接 定理 7.1 判断 本 题 。 

p 1 是否 无 损 连 接 分 析 : 

“ABNBC=B, AB-BC=C, BC-AB=C 

BB 一 4gFt+，B 一 CzgF+， 故 pi 为 有 损 连接 。 

p 是否 无 损 连 接 分 析 : 

“ABNAC=A, AB-AC=B, AC-AB=C 

“4 一 BeF+， 故 p, 为 无 损 连接 。 
注意 ， 尽 管 4 一 Cg +， 但 根据 无 损 连接 定理 充分 必要 条 件 只 要 满足 一 个 即 可 ， 故 9 ,为 
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无 损 连 接 。 
3. 保持 函数 依赖 
【定义 7.21】 设 关系 模式 RU 已 的 一 个 分 解 p= RU 及)R2(U2, 瑟 思 … RUbED)}， 如 果 


1 
mt] ， 则 称 分 解 p 保持 函数 依赖 。 


il 


4. 判别 一 个 分 解 的 无 损 连 接 性 算法 


【算法 7.1】 判别 一 个 分 解 是 否 无 损 连 接 算法 。 

关系 模式 R(U,) 的 一 个 分 解 p= {RI(U1,F),Rs(U2,F2)…, Re(UEFE)}，U={41,4y,…,An}， 
F={FDi,FD,,…, FD,), 并 设 下 是 一 个 最 小 依赖 集 ， 记 FD; 为 X; 4。 判 断 p 是 否 无 损 连接 
的 步骤 如 下 。 

步骤 1: 建立 一 张 n 列 k 行 的 表 ， 每 一 列 对 应 一 个 属性 ， 每 一 行 对 应 分 解 中 的 一 个 关系 模 
式 。 若 属性 4; eU;， 则 在 j 列 i 行 上 填 上 a;， 否 则 填 上 b; ; 

步骤 2: 对 于 每 一 个 FED; 做 如 下 操作 : 找到 XX; 所 对 应 的 列 中 具有 相同 符号 的 那些 行 。 考 察 
这 些 行 中 4; 列 的 元 素 ， 若 其 中 有 a; ， 则 全 部 改 为 a; ， 否 则 全 部 改 为 bw ，m 是 这 些 行 的 行 号 最 
小 值 。 该 步骤 执行 时 注意 如 下 几 点 : 

。 ”如 果 在 某 次 更 改 后 ， 有 一 行 成 为 “al,a,,…,a, ” 则 算法 终止 ， 且 分 解 p 具有 无 损 连 接 

性 ， 否 则 不 具有 无 损 连 接 性 。 

。 对 下 中 个 FD 逐一 进行 一 次 这 样 的 处 理 ， 称 为 对 下 的 一 次 扫描 。 

步骤 3: 比较 扫描 前 后 的 表 有 无 变化 ， 若 有 变化 ， 则 返回 步骤 2， 否 则 算法 终止 。 

如 果 发 生 循环 ， 那 么 前 次 扫描 至 少 应 使 该 表 减 少 一 个 符号 ， 表 中 符号 有 限 ， 因 此 ， 循 环 必 
然 终止。 

【 例 7.21】 关系 模式 R(U,F)， 其 中 U={4B CD 下，F=24C 一 已 ED4 一 B B 一 D }， 请 判 
断 如 下 两 个 分 解 是 否 无 损 连接 的 。 

(1) pi={ Ri (40),R; (ED),R; (4B)} 

(2) ps={ Ri (4BO),R; (ED),R; (ACE)} 

解 : (1) 判断 pi 是 否 无 损 的 。 根 据 算法 7.1 构造 一 个 二 维 矩阵 如 下 表 所 示 。 


4 B © D E | 
a bs a3 bis bs 
b21 bz bz3 as as 
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根据 中 的 4C 一 E, 上 表 中 4C 属性 列 上 没有 两 行 相同 的 , 故 不 能 修改 上 表 。 又 由 于 ED 
上 属性 列 4 


在 EE 属性 列 上 没有 两 行 相同 的 ， 故 不 能 修改 上 表 。 根 据 4-*B 对 上 表 进 行 处 理 ， 由 于 
上 第 一 行 、 第 三 行 相同 为 ays， 所 以 将 属性 列 B 上 bys 改 为 同一 符号 az。 修 改 后 的 表 如 


一 


根据 中 的 BD 对 上 表 进 行 处 理 ， 由 于 属性 列 B 上 第 一 行 、 第 三 行 相 a2， 所 以 将 属 
性 列 D 上 bm 、b3s 改 为 同一 符号 b/s， 取 行 号 最 小 值 ( 因 为 在 属性 列 D 上 的 第 一 行 、 第 三 行 没 


有 as)。 修 改 后 的 表 如 下 : 


反复 检查 函数 依赖 集 无 法 修改 上 表 。 由 于 拷 不 到 一 行为 全 a 故 分 解 pl 是 有 损 的 。 
(2) 判断 ps 是 否 无 损 的 。 根 据 算 法 7.1 构造 一 个 二 维 矩 阵 如 下 表 所 示 。 


Ri(4 BOC) 

Rs(ED) 

Rs(ACE) 
为 {4C EE 一 D， A 一 B, BD }, 根据 中 的 4CE 在 4C 
所 以 将 属性 列 E 上 bis 改 为 同一 符号 as。 修 改 后 的 表 如 


属性 列 上 第 一 行 、 第 


三 行 相同 为 aias， 


Ri(4 BO a 02 a3 bi as 
Rs(ED) bz1 bz bz3 a as 
R3(ACE) ai Da a3 bs3s as 


行 、 第 二 行 、 第 三 行 相同 为 as， 所 以 将 属性 列 D 上 bls、b34 改 为 


ED 在 E 属 性 列 上 第 一 
同一 符号 4。 修 改 后 的 表 如 下 : 
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RI(A BC) 
RED) 

Rs(ACE) 
从 修改 后 的 表 可 以 看 出 第 一 行 全 为 a， 故 分 解 ps 是 无 损 连 接 的 。 


5. 将 关系 模式 转换 成 3NF 且 保 持 函 数 依赖 的 算法 


【算法 7.2】 转换 成 3NF 且 保持 函数 依赖 的 分 解 算 法 。 

步骤 1: 对 R(U 忆 的 函数 依赖 集 刀 进行 极 小 化 处 理 〈 处 理 后 的 结果 仍 记 为 F)。 

步骤 2: 找 出 不 在 中 出 现 的 属性 ， 将 这 样 的 属性 构成 一 个 关系 模式 。 把 这 些 属性 从 UU 中 
去 掉 ， 剩 余 的 属性 仍 记 为 U。 

步骤 3: 若 有 XX >4EF， 且 X4=U， 则 p={ R}， 算 法 终止 。 

步骤 4: 否则 ， 对 已 按 具有 相同 左 部 的 原则 分 组 〈 假 定 分 为 上 组 )， 每 一 组 函数 依赖 五 所 
涉及 的 全 部 属性 形成 一 个 属性 集 Ui。 若 Us Ui (入 ) 就 去 掉 忆 。 由 于 经 过 了 步骤 2， 故 合并 属 
性 集 Ui: U = Uv, 。 于 是 p= {RI(U1,F),R2(U2,F)…,RE(U,)} 构 成 R(U,) 的 一 个 保持 函数 

i=] 

依赖 的 分 解 。 并 且 ， 每 个 R(Ui,) 均 属于 3NF 且 保持 函数 依赖 。 


【 例 7.22】 关系 模式 R(U,F)， 其 中 UE{CTHISG},， F{ CS3GC—TTHE3LHISCHS-}), 将 其 
分 解 成 3NF 并 保持 函数 依赖 。 

解 : 根据 算法 7. 2 求解 如 下 。 

(1) 由 于 五 中 不 存在 元 余 的 函数 依赖 ， 故 已 为 最 小 函数 依赖 集 ， 所 以 转 (2); 

(2) 由 于 RR 中 的 所 有 属性 均 在 F 中 都 出 现 ， 所 以 转 (3); 

(3) 对 FF 按 具 有 相同 左 部 的 原则 分 组 为 R=C5G , R,=CT ,Rs=THI ,Rs=HIC,， 
Rs = HSR 。 所 以 关系 模式 R 分 解 成 3NF 并 保持 函数 依赖 的 分 解 为 : 

p= {RI(CSG),R,(CT),Rs(THI), Ra(HIC), RS(HSR)} 


6， 将 关系 模式 转换 成 3NF 且 无 损 连 接 又 保持 函数 依赖 的 算法 


【算法 7.3】 将 一 个 关系 模式 转换 成 3NF， 使 它 既 具 有 无 损 连接 又 保持 函数 依赖 的 分 解 。 

输入 : 关系 模式 R 和 RR 的 最 小 函数 依赖 集 F。 

输出 :RU 已 的 一 个 分 解 p = {RUL,R),R(U2,)…,Ri(Uj 忆 )}， Ri 为 3NF， 且 p 具有 无 
损 连接 又 保持 函数 依赖 的 分 解 。 

操作 步骤 如 下 。 
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(1) 根据 算法 7.2 求 出 保持 依赖 的 分 解 p= {RUL,F)R(U2,B)…, RUE Pi))}; 

(2) 判 分 解 p 是 否 具有 无 损 连 接 性 ， 若 有 ， 转 〈4); 

(3) 令 p=pU{ 了 ， 其 中 外 是 RR 的 码 ; 

(4) 输出 p。 

【 例 7.23】 对 例 7.22 的 关系 模式 RU 已 将 其 分 解 成 3NF， 使 p 具有 无 损 连 接 又 保持 函数 
依赖 的 分 解 。 

解 : 根据 算法 7.3 求解 如 下 。 

(1) 据 例 7.22 得 3NF 保持 函数 依赖 的 分 解 如 下 : 

p={RI(CSG),R,(CT),R3ATHI), RaA(HIC), RS(HSR)} 

(2) 根据 算法 1 构造 一 个 二 维 矩阵 如 下 表 所 示 。 


Ri(CSG) 
Rs(CT) 
R(THD) 
RsaHIC) 
Rs(HSD 


根据 中 的 CT, 对 上 表 进 行 处 理 ， 由 于 属性 列 C 上 第 一 行 、 第 二 行 及 第 四 行 相同 为 a 
所 以 将 属性 列 了 上 pa、psz 改 为 同一 符号 as。 又 根据 HIC 将 属性 列 C 上 b31、bsi 改 为 同一 符 
号 aq1， 修 改 后 的 表 如 下 : 


子 模式 
RI(CSG) 
Rs(CT) 

R(THD) 
RsHIC) 
Rs(HSD 


根据 已 中 的 CS 一 CG， 对 上 表 进 行 处 理 ， 由 于 属性 列 CS 上 第 一 行 、 第 五 行 相同 为 at 、as， 
所 以 将 属性 列 G 上 bs6 改 为 同一 符号 a6。 又 根据 C7 将 属性 列 T 上 bs, 改 为 同一 符号 wx， 修 
改 后 的 表 如 下 : 
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从 上 可 见 ， 找 到 一 行 ( 第 5 行 ) 为 全 a， 所 以 分 解 p 是 无 损 连 接 并 保持 函数 依赖 的 。 
7， 将 关系 模式 转换 成 BCNF 且 无 损 连 接 的 算法 


【算法 7 


.4】 将 关系 模式 转换 成 BCNF， 使 它 具 有 无 损 连 接 的 分 解 。 


输入 : 关系 模式 R 和 函数 依赖 集 严 。 

输出 : R(U 甩 的 一 个 分 解 P= {RI(U1,R),R2(U2,F)…,Ri(Uk,Fi)}，Ri 为 BCNF,， 且 p 具 有 
无 损 连 接 的 分 解 。 

操作 步骤 如 下 。 

(1) 令 p= 人 如 }; 

(2) 若 p 中 的 所 有 模式 都 是 BCNF， 则 转 (4); 

(3) 若 p 中 Ri 不 属于 BCNF， 则 RR 中 必 能 找到 一 个 函数 依赖 X 一 4eF*(4gX), 且 XX 不 
是 R 的 候选 码 ， 将 Rj 分 解 为 r= {Ri(X4),Ris(R; 一 4)} ， 并 用 分 解 z 代 替 尺 ， 转 (2); 

(4) 输出 p 。 


【 例 7.24】 关 系 模式 R(U,F)， 其 中 U = {CTHLS,G}, F-{ CS>GC—3TTHLHISCHSoT}, 


将 其 无 损 连 接地 分 解 成 BCMF 。 
解 : 检查 眉 发 现 , 有 ,5 只 出 现在 函数 依赖 的 左 部 , 所 以 为 工 类 属性 。 又 因为 在 玉 中 无 NLR 


属性 ， 所 以 R 上 只 有 一 个 候选 码 HS5。 


(1D 令 p={ R(UD}; 


(2) pd 


bh 不 是 所 有 的 模式 都 是 BCNF， 转 (3); 


(3) 考虑 CS 一 G， 这 个 函数 依赖 不 满足 BCNF 条 件 (CS 不 包含 候选 码 HS)， 所 以 将 其 分 
解 成 R(CSG)、R2(CTHIS)。 计 算 RI 和 R; 的 最 小 函数 依赖 集 分 别 为 : 

Fi={ CS 一 G },Fs={C—T,THET,HIOC,HS—T} 

Rs 的 候选 码 为 HS。 

REBCMNF 

… 无 须 分 解 RI 


有 的 


及 中 存在 不 为 码 的 决定 因素 互 一 C 
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“Rug BCNF， 应 当 进 一 步 分 解 R， 

分 解 R: 考虑 CT， 将 其 分 解 成 Ri(CT)、R22(CHIS)。 计 算 Ra 和 Rs 的 最 小 函数 依赖 集 
分 别 为 : Fa={ C=>T},， Fas={CH=>T, HIC, HS 

“CT，TH1， 在 Fy 中， 有 CE 一 7。R2 的 候选 关键 字 为 HS。 

…R2iEBCNF .无 须 分 解 Ra 

“Rw BCNF .需要 进一步 分 解 Rs 

分 解 Rs: 考虑 CH—>I， 将 其 分 解 成 Rai(CED、R2z2(CHS)。 计 算 Ra 和 R22 的 最 小 函数 依 
赖 集 分 别 为 : Fw={ CH ，HISC}, Fys-{HS 一 C}。 

“RE BCNF , RE BCNF 

… 将 R 分 解 后 为 : p={ RI(CSG),R21(C7T),Rza(CHD,R222(CHS)} 
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SQL (Structured Query Language) 是 1974 年 由 Boyce 和 Chamberlin 提出 的 ， 是 在 关系 数 
据 库 中 最 普遍 使 用 的 语言 ， 包 括 数 据 查询 (Query)、 数 据 操 纵 (Manipulation )、 数 据 定义 
(CDefinition) 和 数据 控制 《Control) 功能 ， 是 一 种 通用 的 、 功 能 强大 的 关系 数据 库 的 标准 语言 。 
一 个 SQL 数据 库 是 表 的 汇集 ， 它 用 一 个 或 多 个 SQL 模式 定义 。 基 本 表 是 实际 存储 在 数据 库 中 
的 表 ， 而 视图 是 由 若干 个 基本 表 或 其 他 视图 导出 的 表 ， 称 为 “ 表 ”。 作 为 SQL 的 用 户 可 以 是 应 
用 程序 ， 也 可 以 是 终端 用 户 。 


8.1 数据 库 语言 


8.1.1 数据 库 语 言 概述 


任何 一 个 数据 库 系 统 都 应 向 用 户 提供 一 种 数据 库 语 言 ， 包 括 数据 定义 语言 和 数据 操纵 语 
言 。SQL 语言 是 集 数据 定义 和 数据 操纵 为 一 体 的 典型 数据 库 语言 。 数 据 库 语言 与 数据 模型 密切 
相关 ， 基于 不 同 的 数据 模型 ,数据库 语 言 也 不 同 。 目 前 的 关系 数据 库 系 统 产品 都 提供 SQL 语言 
作为 标准 数据 库 语言 。 

数据 定义 语言 (Data Definition Language，DDL) 用 来 定义 数据 库 模 式 。DDL 包括 数据 
库 模 式 定义 、 数 据 库存 储 结构 和 存 取 方 法 定义 ， 数 据 库 模式 的 修改 和 删除 功能 。 数 据 定义 子 语 
言 的 处 理 程序 分 为 数据 库 模 式 定义 处 理 程序 ， 数 据 库 存储 结构 和 存 取 方 法 定义 处 理 程序 。 数 据 
库 模式 定义 处 理 程序 接收 用 DDL 表示 的 数据 模式 定义 ， 把 其 转变 为 内 部 表示 形式 ， 存 储 到 数 
据 字 典 中 。 数 据 库存 储 结构 和 存 取 方法 定义 处 理 程序 接收 数据 库 系统 存储 结构 和 存 取 方法 定 
义 ， 在 存储 设备 上 创建 相关 的 数据 库 文件 ， 建 立 物理 数据 库 。 
数据 操纵 语言 (Data Manipulation Language，DML) 用 来 表示 用 户 对 数据 库 的 操作 请 求 。 
一 般 地 ， 数 据 操纵 语言 DML 能 表示 如 下 的 数据 库 操作 : 

。 查询 数据 库 中 的 信息 

。 向 数据 库 插入 新 的 信息 

。 ”从 数据 库 删 除 信息 

。 ”修改 数据 库 中 的 信息 

DML 分 为 过 程 性 和 非 过 程 性 两 种 。 过 程 性 语言 要 求 用 户 既 要 说 明 需 要 数据 库 中 的 什么 数 
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据 ， 也 要 说 明 怎样 搜索 这 些 数据 。 非 过 程 性 语言 只 要 求 用 户 说 明 需 要 数据 库 中 的 什么 数据 ， 不 
需要 说 明 怎 样 搜索 这 些 数据 。 非 过 程 性 语言 比 过 程 性 语言 易学 、 易 懂 ， 但 是 非 过 程 性 语言 产生 
的 处 理 程序 代码 要 比 过 程 性 语言 产生 的 代码 效率 低 。 这 个 问题 可 以 通过 查询 优化 来 解决 。 数 据 
操纵 语言 的 核心 是 数据 的 查询 ， 所 以 ， 有 时 人 们 也 常 把 数据 操纵 语言 称 为 数据 查询 语言 ， 严 格 
地 说 这 种 说 法 是 不 确切 的 。 

8.1.2 数据 库 语 言 的 分 类 


SQL (Structured Query Language) 可 以 作为 独立 语言 在 终端 以 交互 的 方式 使 用 ， 也 可 作为 
程序 设计 的 子 语言 使 用 , 即 嵌入 到 高 级 语言 中 使 用 ,这 种 方式 下 使 用 的 SQL 称 之 为 嵌入 式 SQL， 
嵌入 SQL 的 高 级 语言 称 之 为 宿主 语言 。 

在 DBMS 中 ， 对 宿主 型 数据 库 语 言 SQL 采用 两 种 方法 处 理 ， 第 一 种 方法 是 采用 预 编译 ， 
第 二 种 方法 是 修改 和 扩充 主语 言 ， 使 之 能 处 理 SQL 语句 。 

目前 采用 最 多 的 是 预 编译 的 方法 。 该 方法 由 DBMS 的 预 处 理 程序 对 源 程序 进行 扫描 ， 
别 出 SQL 语句 ,把 它们 转换 为 主语 言 调用 语句 ， 以 使 主语 言 编译 程序 能 识别 它 ， 最 后 由 主语 
的 编译 程序 将 整个 源 程序 编译 成 目标 码 。 综 上 所 述 ， 若 要 采用 第 一 种 方法 必须 区 分 主语 言 中 
入 的 SQL 语句 ， 及 主语 言 和 SQL 间 的 通信 问题 ， 后 续 章节 将 分 别 加 以 介绍 。 


2 


Y 


> 


这 贡 


8.2 SQL 概述 


SQL 早已 确立 起 自己 作为 关系 数据 库 标 准 语言 的 地 位 , 已 被 众多 商用 DBMS 产品 如 DB2、 
ORACLE、INGRES、SYSBASE、SQL Server 和 VFP 等 所 采用 ， 使 得 它 已 成 为 关系 数据 库 领域 
中 一 个 主流 语言 。SQL 主要 有 三 个 标准 : ANSI (美国 国家 标准 机 构 ) SQL; 对 ANSI SQL 进行 
修改 后 在 1992 年 采用 的 标准 SQL-92 或 SQL2; SQL-99 标准 ， 也 称 为 SQL3 标准 ，SQL-99 从 
SQL-92 扩充 而 来 ， 并 增加 了 对 象 关系 特征 和 许多 其 他 新 的 功能 ， 最 近 的 版 本 是 SQL: 2003。 


8.2.1 SQL 语言 的 特征 


1，SQL 的 特点 


(1) 综合 统一 。 非 关系 模型 的 数据 语言 分 为 模式 定义 语言 和 数据 操纵 语言 ， 其 缺点 是 当 要 
修改 模式 时 ， 必 须 停 止 现 有 数据 库 的 运行 ， 转 储 数 据 ， 修 改 模式 编译 后 再 重 装 数据 库 。SQL 是 
集 数据 定义 、 数 据 操纵 和 数据 控制 功能 于 一 体 ， 语 言 风格 统一 ， 可 独立 完成 数据 库 生 命 周期 的 
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所 有 活动 。 

(2) 高 度 非 过 程 化 。 非 关系 数据 模型 的 数据 操纵 语言 是 面向 过 程 的 , 若 要 完成 某 项 请 求 时 ， 
必须 指定 存储 路 径 ; 而 SQL 语言 是 高 度 非 过 程 化 语言 , 当 进行 数据 操作 时 , 只 要 指出 “做 什么 ”， 
无 须 指出 “怎么 做 ” 存储 路 径 对 用 户 来 说 是 透明 的 ， 提 高 了 数据 的 独立 性 。 

(3) 面向 集合 的 操作 方式 。 非 关系 数据 模型 采用 的 是 面向 记录 的 操作 方式 ， 操 作对 象 是 一 
条 记录 。 而 SQL 语言 采用 面向 集合 的 操作 方式 ， 其 操作 对 象 、 查 找 结果 可 以 是 元 组 的 集合 。 

(4) 两 种 使 用 方式 。 第 一 种 方式 ， 用 户 可 以 在 终端 键盘 上 输入 SQL 命令 ， 对 数据 库 进行 
操作 ， 故 称 之 为 自 含 式 语言 第 二 种 方式 , 将 SQL 语言 檬 入 到 高 级 语言 程序 中 ， 所 以 又 称 为 嵌 
入 式 语言 。 

(5) 语言 简洁 、 易 学 易 用 。SQL 语言 功能 极 强 ， 完 成 核心 功能 只 用 了 9 个 动词 ， 包 括 如 下 
4 类 。 

。 数据 查询 ， SELECT。 

。 ”数据 定义 : CREATE、DROP、ALTER。 

。 数据 操纵 : INSERT、UPDATE、DELETE。 

。 ”数据 控制 : GRANT、REVORK。 


2. SQL 支持 三 级 模式 结构 


SQL 语言 支持 关系 数据 库 的 三 级 模式 结构 ， 其 中 ， 视 图 对 应 外 模式 、 基 本 表 对 应 模式 、 存 
储 文件 对 应 内 模式 。 具 体 结构 如 图 8-1 所 示 。 


View (视图 一 一 一 外 模式 
Base Table 1 Base Table2 Base Table 3 Base Table4 。 ~ 模式 
(基本 表 ) (基本 表 ) (基本 表 ) (基本 表 ) 
Sored File 1 Sored File 2 Sored File 3 
(存储 文件 ) (存储 文件 ) (存储 文件 ) 一 -一 内 模式 


图 8-1 关系 数据 库 的 三 级 模式 结构 
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8.2.2 SQL 的 基本 组 成 


SQL 由 以 下 几 个 部 分 组 成 。 

(1) 数据 定义 语言 。SQL DDL 提供 定义 关系 模式 和 视图 、 删 除 关系 和 视图 、 修 改 关系 模 
式 的 命令 。 

(2) 交互 式 数据 操纵 语言 。SQL DML 提供 查询 、 插 入 、 删 除 和 修改 的 命令 。 

(3) 事务 控制 (Transaction Control)。SQL 提供 定义 事务 开始 和 结束 的 命令 。 

(4) 嵌入 式 SQL 和 动态 SQL (Embeded SQL and Dynamic SQL)。 用 于 嵌入 到 某 种 通用 的 
高 级 语言 (C、C++、Java、PL/I[、COBOL 和 VB 等 ) 中 混合 编程 。 其 中 ，SQL 负责 操纵 数据 
库 ， 高 级 语言 负责 控制 程序 流程 。 

(5) 完整 性 (Integrity)。SQL DDL 包括 定义 数据 库 中 的 数据 必须 满足 的 完整 性 约束 条 件 
的 命令 ， 对 于 破坏 完整 性 约束 条 件 的 更 新 将 被 禁止 。 

(6) 权限 管理 (Authorization)。SQL DDL 中 包括 说 明 对 关系 和 视图 的 访问 权限 。 


8.3 数据 库 定 义 


8.3.1 基本 域 类 型 
SQL 支持 的 内 部 域 类 型 如 表 8-1 所 示 。 
表 8-1 SQL 数据 类 型 


类 型 说 有明 

char(n) 国定 长 度 字符 串 ， 表 示 n 个 字符 的 固定 长 度 字 符 串 
varchar(n) 可 变 长 度 字符 串 ， 表 示 最 多 可 以 有 n 个 字符 的 字符 串 
int 整 型 ， 也 可 以 用 integer 

smallint 短 整 型 

numeric(p.d) 定点 数 p 为 整数 位 ，n 为 小 数位 

real 浮 点 型 

double precision 双 精 度 浮 点 型 

float(n) n 为 浮 点 型 

boolean 布尔 型 

date 日 期 型 

time 时 间 型 


EI 
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8.3.2 创建 表 (CREATE TABLE) 


语句 格式 : CREATE TABLE < 表 名 >(< 列 名 >< 数 据 类 型 >[ 列 级 完整 性 约束 条 件 ] 
[ < 列 名 >< 数 据 类 型 >[ 列 级 完整 性 约束 条 件 ]]… 
[ < 表 级 完整 性 约束 条 件 >]); 


列 级 完整 性 约束 条 件 有 NULL ( 空 ) 和 UNIQUE ( 取 值 唯一 ), 如 NOTNULL UNIQUE 表 
示 取 值 唯一 ， 不 能 取 空 值 。 

【 例 8.1】 建立 一 个 供应 商 、 零 件数 据 库 。 其 中 关系 供应 商 S (Sno，Sname，Status，City) 
属性 名 分 别 表示 供应 商 代 码 、 供 应 商 名 、 供 应 商 状态 和 供应 商 所 在 城市 ， 关系 零件 P (Pno， 
Pname，Color，Weight，City) 属性 名 分 别 表 示 零 件 号 、 零 伯 名、 颜色、 重量 及 产地 。 该 数据 
库 要 满足 如 下 要 求 。 

(1) 供应 商 代码 不 能 为 空 ， 且 值 是 唯一 的 ， 供 应 商 的 名 也 是 唯一 的 。 

(2) 零件 号 不 能 为 空 ， 且 值 是 唯一 的 ， 零 件 名 不 能 为 空 。 

(3) 一 个 供应 商 可 以 供应 多 个 零件 ， 而 一 个 零件 可 以 由 多 个 供应 商 供应 。 

分 析 : 根据 题 意 ， 供 应 商 和 零件 分 别 要 建立 一 个 关系 模式 。 供 应 商 和 零件 之 间 是 一 个 多 对 
多 的 联系 ， 在 关系 数据 库 中 ， 多 对 多 联系 必须 生成 一 个 关系 模式 ， 而 该 模式 的 码 是 该 联系 两 端 
实体 的 码 加 上 联系 的 属性 构成 的 ， 若 该 联系 名 为 SP， 那么 关系 模式 为 SP (Sno, Pno, Qty)， 其 
中 ，Qty 表示 零件 的 数量 。 

根据 上 述 分 析 ， 用 SQL 建立 一 个 供应 商 、 零 件数 据 库 如 下 : 


CREATE TABLE S(Sno CHAR(5) NOT NULL UNIQUE, 
Sname CHAR(30) UNIQUE, 
Status CHAR(8), 
City CHAR(20) 
PRIMARY KEY(Sno)); 
CREATE TABLE P( Pno CHAR(6), 
Pname CHAR(30) NOT NULL, 
Color CHAR(8), 
Weight NUMERIC(6,2), 
City CHAR(20) 
PRIMARY KEY(Pno)); 
CREATE TABLE SP( Sno CHAR(5), 
Pno CHAR(6), 
Status CHAR(8), 
Qty NUMERIC(9), 
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注 
ll 


PRIMARY KEY(Sno,Pno), 
FOREIGN KEY(Sno) REFERENCES S(Sno), 
FOREIGN KEY(Pno) REFERENCES P(Pno)); 


从 上 述 定义 可 以 看 出 , Sno CHAR(5) NOT NULL UNIQUE 语句 定义 了 Sno 的 列 级 完整 性 
约束 条 件 ， 取 值 唯一 ， 不 能 取 空 值 。 但 需要 说 明 如 下 : 

(1) PRIMARY KEY(Sno) 已 经 定义 了 Sno 为 主 码 ， 所 以 Sno CHAR(5) NOT NULL 
UNIQUE 语句 中 的 NOTNULL UNIQUE 可 以 省 略 。 

(2) FOREIGN KEY(Sno) REFERENCES S(Sno) 定 义 了 在 SP 关系 中 Sno 为 外 码 ， 其 取 值 必 
须 来 自 $S 关系 的 Sno 域 。 同 理 ， 在 SP 关系 中 Pno 也 定义 为 外 码 。 


8.3.3 ”修改 表 和 删除 表 


1. 修改 表 (ALTER TABLE) 


语句 格式 : ALTER TABLE < 表 名 >[ADD< 新 列 名 >< 数 据 类 型 >[ 完 整 性 约束 条 件 ]] 
[DROP< 完 整 性 约束 名 >] 
[MODIFY < 列 名 >< 数 据 类 型 >]; 


例如 ， 向 “供应 商 ” 表 S 增加 Zap“ 邮 政 编码 ”可 用 如 下 语句 : 
ALTER TABLE SADD Zap CHAR(6); 


注意 ， 不 论 基 本 表 中 原来 是 否 已 有 数据 ， 新 增加 的 列 一 律 为 空 。 
又 如 ， 将 Status 字段 改 为 整 型 可 用 如 下 信息 : 


ALTER TABLE S MODIFY Status INT; 


2. 删除 表 (DROP TABLE) 


语句 格式 DROP TABLE < 表 名 > 
例如 ， 执 行 DROP TABLE Student， 此 后 关系 Student 不 再 是 数据 库 模式 的 一 部 分 ， 关 系 中 
的 元 组 也 无 法 访问 。 


8.3.4 创建 和 删除 索引 
1. 索引 的 作用 


数据 库 中 的 索引 与 书籍 中 的 索引 类 似 ， 在 一 本 书 中 ， 利 用 索引 可 以 快速 查找 所 需 信息 ， 无 
须 阅读 整 本 书 。 在 数据 库 中 ， 索 引 使 数据 库 程序 无 须 对 整个 表 进 行 扫描 ， 就 可 以 在 其 中 找到 所 
需 数据 。 书 中 的 索引 是 一 个 词语 列表 ， 其 中 注 明 了 包含 各 个 词 的 页 码 。 而 数据 库 中 的 索引 是 某 
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个 表 中 一 列 或 者 若干 列 值 的 集合 和 相应 的 指向 表 中 物理 标识 这 些 值 的 数据 页 的 逻辑 指针 清单 。 
索引 的 作用 如 下 。 

(1) 通过 创建 唯一 索引 ， 可 以 保证 数据 记录 的 唯一 性 。 

(2) 可 以 大 大 加 快 数据 检索 速度 。 

(3) 可 以 加 速 表 与 表 之 间 的 连接 ， 这 一 点 在 实现 数据 的 参照 完整 性 方面 有 特别 的 意义 。 

(4) 在 使 用 ORDER BY 和 GROUP BY 子 句 中 进行 检索 数据 时 ， 可 以 显著 减少 查询 中 分 组 
和 排序 的 时 间 。 

(5) 使 用 索引 可 以 在 检索 数据 的 过 程 中 使 用 优化 隐藏 器 ， 提 高 系统 性 能 。 

索引 分 为 聚集 索引 和 非 聚 集 索引 。 聚集 索引 是 指 索 引 表 中 索引 项 的 顺序 与 表 中 记录 的 物理 
顺序 一 致 的 索引 。 


2. 建立 索引 


语句 格式 : CREATE [UNIQUE][CLUSTER]INDEX < 索引 名 > 
ON < 表 名 >(< 列 名 >[< 次 序 >][,< 列 名 >[< 次 序 >]]…); 

参数 说 明 如 下 。 

。 次序 ， 可 选 ASC (升序 ) 或 DSC〈 降 序 )， 默 认 值 为 ASC。 

。 UNIQUE: 表明 此 索引 的 每 一 个 索引 值 只 对 应 唯一 的 数据 记录 。 

。 CLUSTER: 表明 要 建立 的 索引 是 聚 秘 索 引 ， 意 为 索引 项 的 顺序 是 与 表 中 记录 的 物 

理 顺序 一 致 的 索引 组 织 。 

【 例 8.2】 假设 供应 销售 数据 库 中 有 供应 商 S、 零 件 P、 工 程 项 目 J 供销 情况 SPJ 关系 ， 
希望 建立 4 个 索引 。 其 中 ， 供 应 商 $ 中 Sno 按 升 序 建立 索引 ; 零件 P 中 Pno 按 升序 建立 索引 ; 
工程 项 目 J 中 Jno 按 升序 建立 索引 ; 供销 情况 SPJ 中 Sno 按 升 序 ，Pno 按 降序 ，Jno 按 升序 建立 
索引 。 

解 : 根据 题 意 建立 的 索引 如 下 。 


CREATE UNIQUE INDEX S-SNO ON S(Sno); 

CREATE UNIQUE INDEX P-PNO ON P(Pno); 

CREATE UNIQUE INDEX JJNO ON J(Jno); 

CREATE UNIQUE INDEX SPJ-NO ON SPJ(Sno ASC,Pno DESC,JNO ASC); 


3. 删除 索引 


语句 格式 : DROP INDEX < 索引 名 > 
例如 ， 执 行 DROP INDEX StudentIndex， 此 后 索引 StudentIndex 不 再 是 数据 库 模 式 的 一 
部 分 。 
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8.3.5 视图 创建 和 删除 


1. 视图 的 作用 


视图 是 从 一 个 或 者 多 个 基本 表 或 视图 中 导出 的 表 ,其 结构 和 数据 是 建立 在 对 表 的 查询 基础 
上 的 。 和 真实 的 表 一 样 ， 视 图 也 包括 几 个 被 定义 的 数据 列 和 多 个 数据 行 ， 但 从 本 质 上 讲 ， 这 些 
数据 列 和 数据 行 来 源 于 其 所 引用 的 表 。 因 此 ， 视 图 不 是 真实 存在 的 基本 表 ， 而 是 一 个 虚拟 表 ， 
视图 所 对 应 的 数据 并 不 实际 地 以 视图 结构 存储 在 数据 库 中 ， 而 是 存储 在 视图 所 引用 的 表 中 。 使 
用 视图 的 优点 和 作用 如 下 。 
(1) 可 以 使 视图 集中 数据 、 简 化 和 定制 不 同 用 户 对 数据 库 的 不 同 数据 要 求 。 
(2) 使 用 视图 可 以 屏蔽 数据 的 复杂 性 ， 用 户 不 必 了 解数 据 库 的 结构 ， 就 可 以 方便 地 使 用 和 
管理 数据 ， 简 化 数据 权限 管理 和 重新 组 织 数据 以 便 输 出 到 其 他 应 用 程序 中 。 

(3) 视图 可 以 使 用 户 只 关心 他 感 兴趣 的 某 些 特定 数据 和 他 们 所 负责 的 特定 任务 ， 而 那些 不 
需要 的 或 者 无 用 的 数据 则 不 在 视图 中 显示 。 

(4) 视图 大 大 地 简化 了 用 户 对 数据 的 操作 。 

(5) 视图 可 以 让 不 同 的 用 户 以 不 同 的 方式 看 到 不 同 或 者 相同 的 数据 集 。 

(6) 在 某 些 情况 下 ， 由 于 表 中 数据 量 太 大 ， 因 此 在 表 的 设计 时 常 将 表 进 行 水 平 或 者 垂直 分 
割 ， 但 表 的 结构 的 变化 对 应 用 程序 产生 不 良 的 影响 。 

(7) 视图 提供 了 一 个 简单 而 有 效 的 安全 机 制 。 


2. 视图 的 创建 


语句 格式 : CREATE VIEW 视图 名 (列表 名 ) 
AS SELECT 查询 子 句 
[WITH CHECK OPTION]; 


注意 : 视图 的 创建 中 ， 必 须 遵循 如 下 规定 。 
(1) 子 查询 可 以 是 任意 复杂 的 SELECT 语句 ,但 通常 不 允许 含有 order by 子 句 和 DISTINCT 
短语 。 
(2) WITH CHECK OPTION 表示 对 UPDATE,INSTER,DELETE 操作 时 保证 更 新 、 插 入 或 
删除 的 行 满足 视图 定义 中 的 谓词 条 件 〈 即 子 查 询 中 的 条 件 表达 式 )。 
(3) 组 成 视图 的 属性 列 名 或 者 全 部 省 略 或 者 全 部 指定 。 如 果 省 略 属性 列 名 ， 则 隐 含 该 视图 
SELECT 子 查询 目标 列 的 主 属性 组 成 。 
【 例 8.3】 若 学 生 关 系 模式 为 Student (Sno,Sname,Sage,Sex,SD,EmailTel)， 建 立 “计算 机 
系 ”(CS 表示 计算 机 系 ) 学 生 的 视图 ， 并 要 求 进行 修改 、 插 入 操作 时 保证 该 视图 只 有 计算 机 系 
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CREATE VIEW CS-STUDENT 

AS SELECT Sno,Sname,Sage,Sex 

FROM Student 

WHERE SD='CS' 

WITH CHECK OPTION; 
由 于 CS-STUDENT 视图 使 用 了 WITH CHECK OPTION 子 句 ， 因 此 ， 对 该 视图 进行 修改 、 
插入 操作 时 DBMS 会 自动 加 上 SD='CS' 的 条 件 ， 保 证 该 视图 只 有 计算 机 系 的 学 生 。 


3. 视图 的 删除 
语句 格式 : DROP VIEW 视图 名 
例如 ，DROP VIEW CS-STUDENT 将 删除 视图 CS-STUDENT。 


8.4 数据 操作 


SQL 的 数据 操纵 功能 包括 SELECT( 查 询 )、INSERT( 插 入 )、DELETE( 删 除 ) 和 UPDATE( 修 
改 ) 四 条 语句 。SQL 语言 对 数据 库 的 操作 十 分 灵活 方便 ， 原 因 在 于 SELECT 语句 中 的 成 分 丰富 多 
样 的 元 组 ， 有 许多 可 选 形式 ， 尤 其 是 目标 列 和 条 件 表 达 式 。 

后 续 内 容 主要 以 “教学 管理 数据 库 ” 为 例 进行 介 绍 ， 为 了 便于 理解 在 未 加 说 明 的 情况 下 ， 
后 续 章节 例题 所 使 用 的 关系 模式 如 下 : 


S (Sno,Sname,SD,Sage,Sex,Addr) ; 关系 模式 学 生 S， 属 性 为 学 号 、 姓 名 、 系 、 年 龄 、 性 别 和 家 庭 地 址 


T (Tno,Tname,Tage,Sex) ; 关系 模式 教师 T， 属 性 为 教师 号 、 姓 名 、 年 龄 和 性 别 
C (Cno,Cname,Pcno) ; 关系 模式 课程 C， 属 性 为 课程 号 、 课 程 名 和 先 修 课程 号 
SC (Sno,Cno,Grade) ; 关系 模式 学 生 选 课 SC， 属 性 为 学 号 、 课 程 号 和 成 绩 


8.4.1 _ Select 基本 结构 


数据 库 查询 是 数据 库 的 核心 操作 ，SQL 语言 提供 了 SELECT 语句 进行 数据 库 的 查询 。 
语句 格式 : SELECT [ALLIDISTINCT]< 目 标 列表 达 式 >[,< 目 标 列表 达 式 >]… 

FROM < 表 名 或 视图 名 >[,< 表 名 或 视图 名 >] 

[WHERE < 条 件 表达 式 >] 

[GROUP BY < 列 名 1>[HAVING< 条 件 表达 式 >]] 

[ORDER BY < 列 名 2>[ASCIDESC]…] 
SQL 查询 中 的 子 句 顺序 为 SELECT、FROM、WHERE、GROUP BY、HAVING 和 ORDER 
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BY。 其 中 ，SELECT、FROM 是 必须 的 ，HAVING 条 件 子 句 只 能 与 GROUP BY 搭配 起 来 使 用 。 
(1) SELECT 子 句 对 应 的 是 关系 代数 中 的 投影 运算 ， 用 来 列 出 查询 结果 中 的 属性 。 其 输出 
可 以 是 列 名 、 表 达 式 、 集 函数 (AVG、COUNT、MAX、MIN、SUM)，DISTINCT 选项 可 以 保 
证 查询 的 结果 集中 不 存在 重复 元 组 。 
(2) FROM 子 句 对 应 的 是 关系 代数 中 的 笛 卡 儿 积 ， 它 列 出 的 是 表达 式 求 值 过 程 中 需 扫描 的 

关系 ， 即 在 FROM 子 句 中 出 现 多 个 基本 表 或 视图 时 ， 系 统 首先 执行 笛 卡 儿 积 操作 。 

(3) WHERE 子 句 对 应 的 是 关系 代数 中 的 选择 谓词 。WHERE 子 句 的 条 件 表达 式 中 可 以 使 
的 运算 符 如 表 8-2 所 示 。 

一 个 典型 的 SQL 查询 具有 如 下 形式 : 

select AAA。 


from ,r,t 


where p 


对 应 关系 代数 表达 式 为 4.4 (0, (nxn x…x1))。 
表 8-2 WHERE 子 句 的 条 件 表 达 式 中 可 以 使 用 的 运算 符 


运算 符 | | 含义 | 运算 符 | 含义 
集合 成 员 运 > 大 于 
算 符 > 大 于 等 于 
与 % 进 行 和 人 
字符 串 匹 配 pa < 小 于 等 于 
之 单个 、 多 个 
运算 符 字符 匹配 一 等 于 
关 不 等 于 
空 值 比较 运 IS NULL 为 空 人 与 
逻辑 运算 符 OR 或 
a | | ma | NOT 非 
8.4.2 简单 查询 


SQL 最 简单 的 查询 是 找 出 关系 中 满足 特定 条 件 的 元 组 , 这 些 查 询 与 关系 代数 中 的 选择 操作 
类 似 。 简 单 查询 只 需要 使 用 三 个 保留 字 SELECT、FROM 和 WHERE。 
【 例 8.4】 查 询 2016 年 计算 机 系 “CS” 学 生 的 学 号 、 姓 名 及 出 生年 份 。 


SELECT Sno,Sname, 2016-Sage 
FROM S 
WHERE SD='CS'; 


注意 ， 通 常 为 了 便于 理解 查询 语句 的 结构 ， 在 写 SQL 语句 时 要 将 保留 字 如 FORM 或 
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WHERE 作为 每 一 行 的 开头 。 但 是 ， 如 果 一 个 查询 或 子 查 询 非 常 短 的 时 候 ， 可 以 直接 将 它们 写 
在 一 行 上 ， 这 种 风格 使 得 查询 语句 很 紧凑 ， 也 具有 很 好 的 可 读 性 。 如 上 例 也 可 写成 如 下 形式 ; 


SELECT Sno, Sname, 2016-Sage FROM S WHERE SD='CS'; 


8.4.3 连接 查询 


若 查询 涉及 两 个 以 上 的 表 ， 则 称 为 连接 查询 。 
【 例 8.5】 检索 选修 了 课程 号 为 “C1” 的 学 生 号 和 学 生 姓名 ， 用 连接 查询 的 实现 方法 如 下 ; 


SELECT Sno, Sname 
FROM  S, SC 
WHERE  S.Sno=SC. Sno AND SC.Cno=' CT 
【 例 8.6】 检索 选修 课程 名 为 “MS” 的 学 生 号 和 学 生 姓名 ,可 用 连接 查询 和 肉 套 查询 实现 ， 
实现 方法 如 下 : 
SELECT Sno,Sname 


FROM  S,SC,C 
WHERE SS. Sno=SC. Sno AND SC.Cno=C.Cno ANDC.Cname='MS' 


【 例 8.7】 检索 至 少 选 修了 课程 号 为 “C1” 和 “C3” 的 学 生 号 ， 实 现 方法 如 下 : 


SELECT Sno 
FROM SCSCX, SCSCY 
WHERE SCX.Sno=SCY. Sno AND SCX.Cno='C1' AND SCY.Cno='C3' 


8.4.4 子 查询 与 聚集 函数 


1. 子 查询 
子 查询 也 称 嵌 套 查询 。 网 套 查 询 是 指 一 个 SELECT-FROM-WHERE 查询 块 可 以 嵌入 另 一 个 


查询 块 之 中 。 在 SQL 中 人 允许 多 重 榜 套 。 
【 例 8.8】 例 8.6 可 以 采用 顽 套 查询 来 实现 。 


SELECT Sno, Sname 
FROM S 
WHERE SnoIN(SELECT Sno 
FROM SC 
WHERE Cno IN (SELECT Cno 
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FROM C 
WHERE Cname=MS)) 


2. 聚集 函数 


聚集 函数 是 一 个 值 的 集合 为 输入 ， 返 回 单个 值 的 函数 。SQL 提供 了 5 个 预定 义 集 函 数 : 平 
均值 avg、 最 小 值 min、 最 大 值 max、 求 和 sum 以 及 计数 count。 如 表 8-3 所 示 。 


表 8-3 集 函 数 的 功能 


集 函 数 名 


COUNT([DISTINCTIALL]*) 


统计 元 组 个 数 
统计 一 列 中 值 的 个 数 
计算 一 列 《〈 该 列 应 为 数值 型 ) 中 值 的 总 和 
计算 一 列 ( 该 列 应 为 数值 型 ) 值 的 平均 值 
求 一 列 值 的 最 大 值 

MIN([DISTINCTIALL]< 列 名 >) 求 一 列 值 的 最 小 值 

使 用 ANY 和 ALL 谓词 必须 同时 使 用 比较 运算 符 ,其 含义 及 等 价 的 转换 关系 如 表 8-4 所 示 。 
用 集 函 数 实 现 子 查询 通常 比 直接 用 ALL 或 ANY 查询 效率 要 高 。 
表 8-4 ANY、ALL 谓词 含义 及 等 价 的 转换 关系 


COUNT([DISTINCTIALL]< 列 名 >) 
SUM([DISTINCTIALL]< 列 名 >) 
AVG([DISTINCTIALL]< 列 名 >) 
MAX([DISTINCTIALL]< 列 名 >) 


谓 词 语 义 等 价 转换 关系 
>ANY 大 于 子 查 询 结 果 中 的 某 个 值 >MIN 
>ALL 大 于 子 查询 结果 中 的 所 有 值 >MAX 
<ANY 小 于 子 查 询 结 果 中 的 某 个 值 <MAX 
<ALL 小 于 子 查询 结果 中 的 所 有 值 <MIN 
>=ANY 大 于 等 于 子 查询 结果 中 的 某 个 值 >=MIN 
>=ALL 大 于 等 于 子 查询 结果 中 的 所 有 值 >=MAX 
<=ANY 小 于 等 于 子 查询 结果 中 的 某 个 值 <=MAX 
<=ALL 小 于 等 于 子 查询 结果 中 的 所 有 值 <=MIN 
>ANY 不 等 于 子 查 询 结果 中 的 某 个 值 — 
<>ALL 不 等 于 子 查询 结果 中 的 任何 一 个 值 NOTIN 
=ANY 等 于 子 查询 结果 中 的 某 个 值 IN 
=ALL 等 于 子 查询 结果 中 的 所 有 值 — 
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【 例 8.9】 查询 课程 C1 的 最 高 分 和 最 低 分 以 及 高 低 分 之 间 的 差距 。 


SELECT MAX(Grade),MIN(Grade), MAX(Grade)-MIN(Grade) 
FROM Sc 
WHERE Cno='C1' 


【 例 8.10】 查询 其 他 系 比 计算 机 系 CS 所 有 学 生年 龄 都 要 小 的 学 生 姓名 及 年 龄 。 
方法 1: (用 ALL 谓词 ) 


SELECT Sname, Sage 


FROM S 
WHERE Sage<ALL(SELECT Sage 
FROMS 
WHERE SD='CS') 
AND SD<>'CS' 


方法 2:( 用 MIN 集 函数 ) 从 等 价 的 转换 关系 表 8-4 中 可 见 ，<ALL 可 用 <MIN 代 换 。 


SELECT Sname, Sage 


FROM S 
WHERE Sage< (SELECT MIN (Sage) 
FROMS 

WHERE SD=CS' ) 
AND SD<>'CS' 


说 明 : 方法 2 实际 上 是 找 出 计算 机 系 年 龄 最 小 的 学 生 的 年 龄 ， 只 要 其 他 系 的 学 生年 龄 比 这 


个 年 龄 小 ， 那 么 就 应 在 结果 集中 。 


【 例 8.11】 查询 其 他 系 比 计算 机 系 某 一 学 生年 龄 小 的 学 生 姓 名 及 年 龄 。 
方法 1: (用 ANY 谓词 ) 


SELECT Sname, Sage 


FROM S 
WHERE Sage<ANY (SELECT Sage 
FROM S 
WHERE SD='CS) 
AND SD<>'CS' 


方法 2:( 用 MAX 集 函 数 ) 从 等 价 的 转换 关系 表 8-4 中 可 见 ，<ANY 可 用 <MAX 代 换 。 


SELECT Sname, Sage 
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FROM S 
WHERE Sage< (SELECT MAX (Sage) 
FROM S 
WHERE SD='CS' ) 
AND SD<>'CS' 


说 明 : 方法 2 实际 上 是 找 出 计算 机 系 年 龄 最 大 的 学 生 的 年 龄 ， 只 要 其 他 系 的 学 生 : 
个 年 龄 小 ， 那 么 就 应 在 结果 集中 。 


8.4.5 “分 组 查询 


内 


FE 龄 比 这 


1. GROUP BY 子 句 


在 WHERE 子 句 后 面 加 上 GROUP BY 子 句 可 以 对 元 组 进行 分 组 ,保留 字 GROUP BY 后 面 
跟着 一 个 分 组 属性 列表 。 最 简单 的 情况 是 FROM 子 句 后 面 只 有 一 个 关系 , 根据 分 组 属性 对 它 的 
元 组 进行 分 组 。SELECT 子 句 中 使 用 的 聚集 操作 符 仅 用 在 每 个 分 组 上 。 

【 例 8.12】 学 生 数 据 库 中 的 SC 关系 ， 查 询 每 个 学 生 的 平均 成 绩 。 


SELECT Sno,AVG(Grade) 
FROM SC 
GROUP BY Sno 


该 语句 是 将 SC 关系 的 元 组 重新 组 织 , 并 进行 分 组 使 得 不 同学 号 的 元 组 分 别 被 组 织 在 一 起 ， 
最 后 求 出 各 个 学 生 的 平均 值 输出 。 


2. HAVING 子 句 


假如 元 组 在 分 组 前 按照 某 种 方式 加 上 限制 ， 使 得 不 需要 的 分 组 为 空 ， 可 以 在 GROUP BY 
子 句 后 面 跟 一 个 HAVING 子 句 即 可 。 

注意 : 当 元 组 含有 空 值 时 ， 应 该 记 住 以 下 两 点 。 

(1) 空 值 在 任何 聚集 操作 中 被 忽视 。 它 对 求 和 、 求 平均 值 和 计数 都 没有 影响 。 它 也 不 能 是 
某 列 的 最 大 值 或 最 小 值 。 例 如 ，COUNT (*) 是 某 个 关系 中 所 有 元 组 数目 之 和 , 但 COUNT (A) 
却 是 A 属性 非 空 的 元 组 个 数 之 和 。 

(2) NULL 值 又 可 以 在 分 组 属性 中 看 作 是 一 个 一 般 的 值 。 例 如, SELECT A ,AVG(B) FORM 
R 中 ， 当 A 的 属性 值 为 空 时 ， 就 会 统计 A=NULL 的 所 有 元 组 中 B 的 均值 。 

【 例 8.13】 供应 商 数据 库 中 的 S$S、P、J、SPJ 关系 ， 查 询 某 工程 至 少 用 了 三 家 供应 商 ( 包 
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含 三 家 ) 供应 的 零件 的 平均 数量 ， 并 按 工程 号 的 降序 排列 。 
SELECT Jno,AVG(Qty) 
FROM SPJ 
GROUP BY Jno 
HAVING COUNT(DISTINCT(Sno)> 2 
ORDER BY Jno DESC; 
根据 题 意 “ 某 工程 至 少 用 了 三 家 供应 商 ( 包 含 三 家 ) 供应 的 零件 ” 应 该 按照 工程 号 分 组 ， 
而 且 应 该 加 上 条 件 供应 商 的 数目 。 但 是 需要 注意 的 是 ， 一 个 工程 项 目 可 能 用 了 同一 个 供应 商 的 
多 种 零件 ， 因 此 ， 在 统计 供应 商 数 的 时 候 需 要 加 上 DISTINCT， 以 避免 重复 统计 导致 错误 的 结 
果 。 例 如 ， 按 工程 号 Ino=']1' 分 组 ， 其 结果 如 表 8-5 所 示 。 如 果 不 加 DISTINCT， 统 计 的 结果 数 
为 7; 而 加 了 DISTINCT， 统 计 的 结果 数 为 5。 
表 8-5 按 工 程 号 Jno='J1' 分 组 


Sno Jno Qty 
sl 本 200 
S2 本 400 
S2 J1 200 
S2 本 100 
S3 本 200 
S4 本 300 
S5 本 200 
8.4.6 更 名 操作 
SQL 提供 可 为 关系 和 属性 重新 命名 的 机 制 ， 这 是 通过 使 用 具有 如 下 形式 的 as 子 句 来 实现 的 : 


Old-name as new-name 


As 子 句 即 可 出 现在 SELECT 子 句 ， 也 可 出 现在 FROM 子 句 中 。 
【 例 8.14】 查询 计算 机 系 学 生 的 Sname 和 Sage， 要 求 Sname 用 “姓名 ”表示 ，Sage 用 “年 
龄 ”表示 。 其 语句 如 下 : 


SELECT Sname as 姓名 , Sage as 年 龄 
FROM S 
WHERE Age< (SELECT MAX (Sage) 
FROM S 
WHERE SD=CS) 
AND SD<>'CS'; 
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SQL 中 的 元 组 变量 必须 和 特定 的 关系 相 联系 .元 组 变量 是 通过 FROM 子 句 中 使 用 As 子 句 
来 定义 的 。 特 别 是 ， 元 组 变量 在 比较 同一 关系 的 两 个 元 组 时 非常 有 用 。 通 过 例 8.15 来 说 明 。 

【 例 8.15】 查询 平均 成 绩 至 少 比 学 号 为 “1004” 平 均 成 绩 高 的 Sno 和 avg(Grade)。 要 
求学 号 Sno 用 “学 号 ”表示 ，avg(Grade) 用 “平均 成 绩 ” 表 示 。 其 语句 如 下 : 


SELECT Sno as 学 号 , avg(Grade) as 平均 成 绩 
FROM SCasx 
GROUP BY sno 
HAVING avg(Grade) > (SELECT avg(Grade) 
FROM SCasy 
WHERE ysno='1004) 


8.4.7 字符 串 操 作 


对 于 字符 串 进行 的 最 通常 的 操作 是 使 用 操作 符 like 的 模式 匹配 。 使 用 两 个 特殊 的 字符 来 描 
述 模式 :“%” 匹 配 任意 字符 串 ;“_” 匹 配 任意 一 个 字符 。 模 式 是 大 小 写 敏感 的 。 例 如 : 

Marry% 匹 配 任何 以 Marry 开头 的 字符 串 ，%idge% 匹 配 任何 包含 idge 的 字符 串 ， 例 如 
Marryidge、Rock Ridge、Mianus Bridge 和 Ridgeway。 

“ ”匹配 只 含 两 个 字符 的 字符 串 ;“__%” 匹 配 至 少 包含 两 个 字符 的 字符 串 。 

【 例 8.16】 学 生 关系 模式 为 (Sno,Sname,Sex,SD,Sage,Sex,Addr), 其 中 , Sno 为 学 号 , Sname 
为 姓名 ，Sex 为 性 别 ，SD 为 所 在 系 ，Sage 为 年 龄 ，Addr 为 家 庭 地 址 。 请 查询 : 

(1) 家 庭 地 址 包含 “科技 路 ”的 学 生 姓 名 。 

(2) 名 字 为 “ 晓 军 ”的 学 生 姓 名 、 年 龄 和 所 在 系 。 

解 : 
(1) 家 庭 住址 包含 “科技 路 ”的 学 生 姓名 的 SQL 语句 如 下 : 
SELECT Sname 


FROM S 
WHERE Addr like '% 科 技 路 %' 


(2) 名 字 为 “ 晓 军 ” 的 学 生 姓 名 、 年 龄 和 所 在 系 的 SQL 语句 如 下 : 


SELECT Sname,Sage,SD 
FROM S 
WHERE Sname LIKE' 了 晓 军 ' 


为 了 使 模式 中 包含 特殊 模式 字符 〈 即 % 和 _)， 在 SQL 中 允许 使 用 escape 关键 词 来 定义 转 
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义 符 。 转 义 字符 紧 靠 着 特殊 字符 ， 并 放 在 它 的 前 面 ， 表 示 该 特殊 字符 被 当成 普通 字符 。 例 如 ， 
在 like 比较 中 使 用 escape 关键 词 来 定义 转 义 符 ， 例 如 使 用 反 斜 杠 “\” 作 为 转 义 符 。 


Like 'ab\%cd%'escape \， 匹 配 所 有 以 ab%cd 开头 的 字符 串 。 
Like 'ab\cd%'escape \， 匹 配 所 有 以 abvcd 开头 的 字符 串 。 


8.4.8 ”集合 操作 


在 关系 代数 中 可 以 用 集合 的 并 、 交 和 差 来 组 合 关系 。SQL 也 提供 了 对 应 的 操作 ， 但 是 查询 
的 结果 必须 具有 相同 的 属性 和 类 型 列表 。 保 留 字 UNION、INTERSECT 和 EXCEPT 分 别 对 应 
Un 和 一 。 保 留 字 用 于 两 个 查询 时 ， 应 该 将 每 个 查询 分 别 用 括号 括 起 来 。 为 了 便于 理解 ， 下 面 
通过 举例 说 明 。 


1. UNION 运算 


假设 某 银行 关系 模式 Branch〈 分 行 )、Customer (客户 )、Loan (贷款 )、Borrower (贷款 联 
Account (账户 ) 和 Depositor (存款 联系 ) 如 下 : 


Branch (branch-name, branch-city, assets) 


系 )、 


_ 


Customer (customer-no, customer-name, customer - city) 


Loan (loan-no, branch-name, amount) 


Borrower (customer-no, loan-no) 


Account (account-no, branch-name, balance) 


Depositor (customer-no, account-no) 


上 述 关系 模 式 中 ，Customer-no 表示 客户 的 身份 证 号 ， 带 下 画 线 的 是 主键 属性 。 

【 例 8.17】 假设 查询 所 有 客户 的 集合 的 语句 @ 为 : SELECT Customer-no FROM depositor; 
查询 有 贷款 客户 的 集合 的 语句 @ 为 : SELECT Customer-no FROM borrower。 查询 在 银行 有 账户 、 
有 贷款 或 两 者 都 有 的 所 有 客户 身份 证 号 。 存 款 Deposit 余额 remaining sum remainder 

解 : 本 题 可 以 通过 对 语句 OO 和 @ 取 并 集 ， 结 果 如 下 。 


(SELECT Customer-no FROM depositor) 
UNION 
(SELECT Customer-no FROM borrower) 


与 SELECT 子 句 不 同 的 是 UNION 运算 自动 去 除 重复 ， 即 某 客 户 在 银行 中 有 几 个 账户 或 贷 
款 〈 或 两 者 均 有 )， 那 么 在 结果 集中 也 只 出 现 一 次 。 如 果 需 要 保留 重复 ， 必 须 用 UNION ALL， 
示例 如 下 : 
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(SELECT Customer-no FROM depositor) 
UNION ALL 
(SELECT Customer-no FROM borrower) 


查询 结果 出 现 重 复元 组 数 等 于 在 查询 语句 各 中 出 现 的 重复 元 组 的 和 ， 如 某 客 户 
Customer-no 为 “100982000011112124” 在 银行 有 2 个 账户 3 笔 贷款 ,那么 在 结果 集中 有 五 个 元 
组 含有 “100982000011112124”。 


2. INTERSECT 运算 

【 例 8.18】 假定 学 生 和 教师 关系 模式 如 下 所 示 ， 查 询 既 是 女 研究 生 ， 又 是 教师 且 工 资 大 于 
等 于 2600 元 的 名 字 和 地 址 。 

Students(Name, Sno, SEX, SD, Type, Address) 

Teachers(Name, Eno, SEX, Salary, Address) 

解 : 本 题 第 一 条 SELECT 语句 查询 和 第 二 条 SELECT 语句 查询 的 结果 集 模式 都 为 (Name， 
Address)， 故 可 以 对 它们 取 交 集 。 


(SELECT Name, Address 
FROM Students 
WHERE SEX==' 女 'AND Type 一 ' 研 究 生 ) 
INTERSECT 
(SELECT Name, Address 
FROM Teachers 
WHERE Salary >=2600) 


3. EXCEPT 运算 


同 理 ， 我 们 也 可 以 对 两 个 相同 结果 集 的 关系 取 差 集 。 
【 例 8.19】 查询 不 是 教师 的 学 生 姓名 。 


(SELECT Name, Address FROM Students) 
EXCEPT 
(SELECT Name, Address FROM Teachers) 


8.4.9 视图 查询 与 更 新 
1. 视图 查询 
【 例 8.20】 建立 “计算 机 系 ”(CS 表示 计算 机 系 ) 学 生 的 视图 如 下 ， 并 要 求 进行 修改 、 插 
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入 操作 时 保证 该 视图 只 有 计算 机 系 的 学 生 。 


CREATE VIEW CS- Student 


AS SELECT Sno,Sname,Sage,Sex 


FROM Student 
WHERE SD='CS' 
WITH CHECK OPTION; 


此 时 要 查询 计算 机 年 龄 小 于 20 岁 的 学 号 及 年 龄 的 SQL 语句 如 下 : 
SELECT Sno,Sage FORM CS- Student WHERE SD='CS' AND Sage<20; 


系统 执行 该 语句 时 ， 通 常 先 将 其 转换 成 等 价 的 对 基本 表 的 查询 ， 然 后 执行 查询 语句 。 即 当 
查询 视图 表 时 ， 系 统 先 从 数据 字典 中 取出 该 视图 的 定义 ， 然 后 将 定义 中 的 查询 语句 和 对 该 视图 
的 查询 语句 结合 起 来 ， 形 成 一 个 修正 的 查询 语句 。 对 上 例 修正 之 后 的 查询 语句 为 : 


SELECT Sno, Sage FORM Student WHERE SD='CS' AND Sage<20; 


2. 视图 更 新 


SQL 对 视图 更 新 必须 遵循 以 下 规则 : 

(1) 从 多 个 基本 表 通 过 连结 操作 导出 的 视图 不 允许 更 新 。 

(2) 对 使 用 了 分 组 、 集 函数 操作 的 视图 则 不 允许 进行 更 新 操作 。 

(3) 如 果 视 图 是 从 单个 基本 表 通 过 投影 、 选 取 操作 导出 的 则 允许 进行 更 新 操作 ， 且 语法 同 


基本 表 。 


3. With 子 句 


如 果 我 们 将 一 个 复杂 查询 分 解 成 一 些小 视图 ， 然 后 将 它们 组 合 起 来 ， 就 像 将 一 个 程序 按 其 
任务 分 解 成 一 些 过 程 一 样 ， 使 得 复杂 查询 的 编写 和 理解 都 会 简单 得 多 。 然 而 和 过 程 定义 不 同 的 


是 Create view 子 句 会 在 数据 库 品 


建立 视图 定义 ,该 视图 定义 会 一 直 保存 ,直到 执行 drop view 命 


令 。 但 是 ，With 子 句 提供 了 定义 一 个 临时 视图 的 方法 ， 该 定义 只 对 With 子 句 出 现 的 那 条 查询 


有 效 。 


【 例 8.21】 假定 教师 关系 模式 为 Teachers(TName，Eno，Tdept，SEX，Salary，Address)， 
利用 With 子 句 查 询 工资 最 高 的 教师 姓名 。 此 时 ， 如 果 具 有 同样 工资 最 高 的 教师 有 多 个 ， 它 们 


解 : 


with max-Salary(value) AS 
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展 
吊 


SELECT max(Salary) 
FROM Teachers 
SELECT Tname 
FROM Teachers, max-Salary 
WHERE Teachers.Salary = max-Salary.value 


With 子 句 是 在 SQL 99 中 引入 的 ， 目 前 只 有 部 分 数据 库 支 持 这 一 子 句 。 

用 FROM 子 名 或 WHERE 子 句 中 的 典 套 子 查询 也 能 实现 上 述 查 询 , 但 是 采用 这 样 的 方法 会 
使 查询 语句 可 读 性 差 。With 子 句 使 查询 逻辑 上 更 加 清晰 ， 它 还 允许 在 一 个 查询 中 多 处 使 用 一 个 
数据 定义 。 

【 例 8.22】 假定 银行 账户 关系 模式 为 Account(Account-no，branch-name，balance)， 其 中 属 
性 Account-no 表示 账号 ，branch-name 表示 支行 名 称 ，balance 表示 余额 。 利用 With 子 句 查询 所 
有 存款 总 额 少 于 所 有 支行 平均 存款 总 额 的 支行 。 

解 : 

with branch-total(branch-name, value) AS 

SELECT branch-name, sum(balance) 
FROM Account 
GROUP BY branch-name 
with branch-total-avg(value) AS 
SELECT avg(value) 
FROM branch-total 
SELECT branch-name 
FROM branch-total, branch-total-avg 


WHERE branch-total.value >= branch-total-avg.value 


8.5 SQL 中 的 授权 


数据 库 的 完整 性 是 指数 据 库 正 确 性 和 相 容 性 ， 是 防止 合法 用 户 使 用 数据 库 时 向 数据 库 加 入 
不 符合 语义 的 数据 。 保 证 数据 库 中 数据 是 正确 的 ， 避 免 非法 的 更 新 。 数 据 库 完整 性 重点 需要 掌 
握 的 内 容 有 : 完整 性 约束 条 件 的 分 类 、 完 整 性 控制 应 具备 的 功能 。 


8.5.1 主键 (Primary Key ) 约束 


1. 完整 性 约束 条 件 
完整 性 约束 条 件 作用 的 对 象 有 关系 、 元 组 、 列 三 种 ， 共 分 为 六 类 ， 如 表 8-6 所 示 。 


JJ 
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表 8-6 ”完整 性 约束 条 件 


状态 约束 对 象 说 明 
和 是 对 一 个 列 的 取 值 域 的 说 明 。 包括 : 数据 类 型 的 约束 、 数据 格式 的 约束 (如: 
列 级 约束 “| yyMM.DD)、 取 值 范围 的 约束 、 空 值 的 约束 
静态 二 次 规定 元 组 各 列 之 间 的 约束 关系 。 如 : 教师 关系 中 的 职称 和 工资 ， 规 定 教授 的 
元 组 约束 | 工资 不 得 低 于 1000 元 
关系 约束 实体 完整 性 约束 、 参 照 完整 性 约束 、 函 数 依赖 约束 、 统 计 约 束 
列 级 约束 ”| 修改 列 定义 时 的 约束 、 修 改 列 值 时 的 约束 
轩 ”| 指 修改 元 组 值 时 元 组 中 各 个 字段 间 需 要 满足 的 某 种 约束 条 件 。 如 : 工资 = 基 
动态 元 组 约束 本 工资 + 工龄 X2 
关系 约束 是 加 在 关系 变化 前 后 状态 上 的 限制 条 件 
2. 完整 性 控制 


完整 性 控制 应 具有 三 方面 的 功能 :定义 功能 、 检 测 功 能 、 处 理 功 能 (一 旦 发 现 违背 了 完整 
性 约束 条 件 ， 采 取 相 关 的 动作 来 保证 数据 的 完整 性 )。 
检查 是 否 违背 完整 性 约束 的 时 机 有 两 种 ， 若 在 一 条 语句 执行 完 后 立即 检查 称 为 立即 执行 约 
束 ; 若 检查 需要 延迟 到 整个 事务 执行 完 后 再 执行 称 为 延迟 执行 约束 。 


数据 库 中 最 如 


要 的 约束 是 声明 一 个 或 一 组 属性 形成 关系 的 键 。 键 的 约束 在 SQL 的 CREATE 


TABLE 命令 中 声明 。 在 关系 系统 中 ， 最 重要 的 完整 性 约束 条 件 是 : 实体 完整 性 和 参照 完整 性 。 
3. 实体 完整 性 〈 使 用 “PRIMARY KEY” 子 句 ) 
在 关系 中 只 能 有 一 个 主键 。 声 明 主 键 有 两 种 方法 : 
@ 将 PRIMARYKEY 保留 字 加 在 属性 类 型 之 后 ; 
@ 在 属性 列表 中 引入 一 个 新 元 素 ， 该 元 素 包含 保留 字 PRIMARY KEY 和 


形成 该 键 的 


属性 或 


属性 组 列表 。 


上 圆 括号 括 起 的 


【 例 8.23】 学 生 关 系 Students(Sno,Sname,Sex,Sdept,Sage) 的 主键 是 Sno， 在 创建 学 生 关 系 


时 可 使 用 PRIMARY KEY 进行 实体 完整 性 约束 。 创 建 学 生 表 的 SQL 语句 如 下 : 


CREATE TABLE Students 
( Sno CHAR(8)， 


Sname CHAR(10), 
Sex CHAR(1), 
Sdept CHAR(20), 
Sage NUMBER(3), 
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懂 
ll 


PRIMARY KEY(Sno)); 
或 采用 如 下 方法 创建 : 
CREATE TABLE Students 
(Sno CHAR(8) PRIMARY KEY, 
Sname CHAR(10), 
Sex CHAR(]1), 
Sdept CHAR(20), 
Sage NUMBER(3))); 


当主 键 有 多 个 属性 时 必须 用 第 一 种 方法 。 
【 例 8.24】 学 生 选课 关系 SC(Sno,Cno,Grade) 的 主键 为 Sno,Cno， 创 建 学 生 选 课表 的 SQL 
语句 如 下 : 


CREATE TABLE SC 
(Sno CHAR(8), 
Cno CHAR(4), 
Grade NUMBER(3), 
PRIMARY KEY(Sno), 
PRIMARY KEY(Cno)); 


8.5.2 ”外 键 (Foreign Key ) 约束 
参照 完整 性 定义 格式 如 下 : 


FOREIGN KEY (属性 名 ) REFERENCES 表 名 (属性 名 ) 
[ON DELETE[CASCADEISET NULL] 


参照 完整 性 是 通过 使 用 如 下 保留 字 : FOREIGN KEY 定义 那些 列 为 外 码 ; REFERENCES 
指明 外 码 对 应 于 哪个 表 的 主 码 ，ON DELETE CASCADE 指明 删除 被 参照 关系 的 元 组 时 ， 同 时 
删除 参照 关系 中 的 元 组 ， SET NULL 表示 置 为 空 值 方式 。 

【 例 8.25】 对 于 例 8.24 学 生 选 课 关 系 SC(Sno,Cno,Grade) 中 ， 学 号 Sno 参照 关系 Students， 
课程 号 Cno 参照 关系 C。 因 此 对 于 例 8.24 的 完整 的 语句 为 : 


CREATE TABLE SC 
(Sno CHAR(8), 
Cno CHAR(4), 
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8.5.3 


Grade NUMBER(3), 

PRIMARY KEY(Sno), 

PRIMARY KEY(Cno), 

FOREIGN KEY Sno REFERENCES Students(Sno), 
FOREIGN KEY Cno REFERENCES C(Cno)); 


属性 值 上 的 约束 


属性 值 上 的 约束 可 以 通过 not null、unique 和 check 进行 ， 其 中 : 


not null: 在 SQL 中 ，null 值 是 所 有 域 的 成 员 ， 也 是 每 个 属性 默认 的 合法 值 。 但 是 ， 根 
据 用 户 要 求 有 些 属性 不 允许 取 空 值 ， 此 时 可 用 “not null” 进 行 约束 。 例 如 ， 银 行 的 账 
户 关系 Account(Account-no，branch-name，balance) 不 允许 余额 balance 取 空 值 ， 此 时 
可 用 “balance numeric(12,2) not null” 进 行 约束 ， 即 禁止 在 该 属性 上 插入 一 个 空 值 。 
unique: 唯一 标识 数据 库 表 中 的 每 条 记录 。 

check: check 子 句 可 用 于 保证 属性 值 满足 指定 的 条 件 。 例 如 ， 银 行 关 系 Branch 
(branch-name, branch-city, assets ) 要 求 资产 assets 不 能 为 负 值 , 此 时 可 用 “check (assets 
=0)” 进 行 约束 。 


【 例 8.26】 学 生 关系 Students(Sno,Sname,Sex,Sdept,Sage), 假设 用 户 要 求学 生 姓 名 不 能 为 空 ， 
男生 的 年 龄 在 15 一 25 岁 之 间 ， 女 生 的 年 龄 在 15 一 23 岁 之 间 。 那 么 可 使 用 如 下 语句 创建 表 : 


CREATE TABLE Students 


8.5.4 


全 
系 间 的 


(Sno CHAR(8), 
Sname CHAR(10) NOT Null, 
Sex CHAR(1), 
Sdept CHAR(20), 
Sage NUMBER(3), 
PRIMARY KEY(Sno)) 
CHECK (Sage >=15 AND ((SEX='M' AND Sage <=25)OR 
(SEX='F' AND Sage <23)); 


全 局 约束 
局 约束 是 指 一 些 比较 复杂 的 完整 性 约束 ， 这 些 约束 涉及 多 个 属性 间 的 联系 或 多 个 不 同 关 


关系 。 有 两 种 : 基于 元 组 的 检查 子 句 和 断言 。 
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(1) 基于 元 组 的 检查 子 句 
这 种 约束 是 对 单个 关系 的 元 组 值 加 以 约束 。 方 法 是 在 关系 定义 中 的 任何 地 方 加 上 关键 字 
CHECK 和 约束 条 件 。 
例如 ， 年 龄 在 16 至 20 岁 之 间 ， 可 用 CHECK (Sage>=16 AND Sage<=20) 检 测 。 
(2) 基于 断言 的 语法 格式 
格式 : CREATE ASSERTION < 断言 名 > CHECK(< 条 件 >) 
【 例 8.27】 教学 数据 库 的 模式 Students、SC、C 中 创建 一 个 约束 ASSE-SC1: 不 允许 男 同 
学 选修 “ 张 勇 ”老师 的 课 。 
解 : 可 写成 如 下 的 断言 形式 : 〈 基 于 断言 的 举例 ) 
CREATE ASSERTION ASSE-SC1 CHECK 
(NOT EXISTS 
(SELECT* FROM SC WHERE Cno IN 
(SELECT Cno FROM C WHERE TEACHER=' 张 勇 ') 
AND Sno IN 
(SELECT Sno FROM Students WHERE SEX="M"))); 


【 例 8.28】 教学 数据 库 的 模式 Students、SC、C 中 创建 一 个 约束 ASSE-SC2: 每 门 课 最 多 
允许 50 名 男 同学 选修 。 
解 : 可 写成 如 下 的 断言 形式 : 


CREATE ASSERTION ASSE-SC2 CHECK 
(50>=ALL(SELECT COUNT(SC.Sno) 
FROM Students,SC 
WHERE Students.Sno=SC.Sno AND SEX="M' 
GROUP BY Cno)); 


8.5.5 授权 (GRANT ) 与 销 权 (REVOKE ) 


数据 控制 的 是 控制 用 户 对 数据 的 存储 权力 ， 是 由 DBA 来 决定 的 。 但 是 ， 某 个 用 户 对 某 类 
数据 具有 何 种 权利 ， 是 个 政策 问题 而 不 是 技术 问题 。DBMS 的 功能 就 是 保证 这 些 决定 的 执行 。 
因此 ，DBMS 数据 控制 应 具有 如 下 功能 。 

(1) 通过 GRANT 和 REVOKE 将 授权 通知 系统 ， 并 存 入 数据 字典 。 

(2) 当 用 户 提出 请 求 时 ， 根 据 授权 情况 检查 是 否 执行 操作 请 求 。 

SQL 标准 包括 delete、insert、select 和 update 权限 。select 权限 对 应 于 read 权限 ，SQL 还 

包括 了 references 权限 ， 用 来 限制 用 户 在 创建 关系 时 定义 外 码 的 能 力 。 
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1. 授权 的 语句 格式 


GRANT < 权限 >[,< 权 限 >]...[ON< 对 象 类 型 >< 对 象 名 >]TO < 用 户 >[,< 用 户 ]>].… 
[WITH GRANT OPTION]; 


注意 : 不 同类 型 的 操作 对 象 有 不 同 的 操作 权限 ， 常 见 的 操作 权限 如 表 8-7 所 示 。 
表 8-7 常见 的 操作 权限 


对 象 操作 权限 
属性 列 SELECT, INSERT, UPDATE, DELETE, 
和 ALL PRIVILEGES (4 种 权限 的 总 和 ) 
视图 SELECT, INSERT, UPDATE, DELETE, 


ALL PRIVILEGES 4 种 权限 的 总 和 ) 

a SELECT, INSERT, UPDATE, DELETE, ALTER, INDEX 
人 ALL PRIVILEGES (6 种 权限 的 总 和 ) 

数据 库 CREATETAB 建立 表 的 权限 ， 可 由 DBA 授予 普通 用 户 


说 明 如 下 。 
。 PUBLIC: 接受 权限 的 用 户 可 以 是 单个 或 多 个 具体 的 用 户 ，PUBLIC 参数 可 将 权限 
赋 给 全 体 用 户 。 
。 WITH GRANT OPTION: 若 指定 了 此 子 句 ， 那 么 获得 了 权限 的 用 户 还 可 以 将 权限 
赋 给 其 他 用 户 。 
【 例 8.29】 如 果 用 户 要 求 把 数据 库 SPJ 中 供应 商 S$、 零件 P、 项 目 了 表 赋 予 各 种 权限 。 各 
种 授权 要 求 如 下 : 
(1) 将 对 供应 商 S、 零 件 P、 项 目的 所 有 操作 权限 赋 给 用 户 Userl 及 User2; 
(2) 将 对 供应 商 S 的 插入 权限 赋 给 用 户 Userl， 并 允许 将 此 权限 赋 给 其 他 用 户 ; 
(3) DBA 把 数据 库 SPJ 中 建立 表 的 权限 赋 给 用 户 Userl 。 
解 : 
(1) 的 授权 语句 如 下 : 


GRANTALL PRIVILEGES ON TABLE S,PJ] TO Userl, User2; 
(2) 的 授权 语句 如 下 : 
GRANT INSERT ON TABLE S TO Userl WITH GRANT OPTION:; 


(3) 的 授权 语句 如 下 : 
GRANT CREATETAB ON DATABASE SPJ TO Userl; 
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2. 收回 权限 语句 格式 
REVOKE < 权限 >[,< 权 限 >]…[ON< 对 和 象 类 型 >< 对 和 象 名 >] 
FROM < 用 户 >[,< 用 户 ]>]…; 


【 例 8.30】 要 求 回收 用 户 对 数据 库 SPJ 中 供应 商 S$、 零 件 P、 项 目 了 表 的 操作 权限 。 各 种 
收回 权限 的 要 求 如 下 : 

(1) 将 用 户 Userl 及 User2 对 供应 商 S、 零 件 P、 项 目的 所 有 操作 权限 收 

(2) 将 所 有 用 户 对 供应 商 S 的 所 有 查询 权限 收回 。 

(3) 将 Userl 用 户 对 供应 商 $ 的 供应 商 编号 Sno 的 修改 权限 收回 。 

解 : 


(1) 的 收回 权限 语句 如 下 : 

REVOKE ALL PRIVILEGES ON TABLE S,PJ FROM Userl, User2; 
(2) 的 收回 权限 语句 如 下 : 

REVOKE SELECT ON TABLE S FROM PUBLIC; 

(3) 的 收回 权限 语句 如 下 : 

REVOKE UPDATE(Sno) ON TABLE S FROM Userl; 


【 例 8.31】 收回 用 户 二 对 表 employee 的 查询 权限 ， 同 时 级 联 收回 二 授予 其 他 用 户 的 该 权 
限 ，SQL 语句 为 : _ (1) _ selectON TABLE employee FROM1li _ (2) ; 


加 


(1) A. GRANT B. GIVE C. CALL BACK D. REVOKE 
(2) A. RESTRICT B. CASCADE 
C. WITH GRANT OPTION D. WITH CHECK OPTION 
例题 分 析 : 〈1) 的 正确 选项 为 D，(2) 的 正确 选项 为 B。 因 为 ， 收 回 权限 的 SQL 语法 : 
REVOKE < 权限 列表 > ON < 表 名 | 视图 名 > 


FROM < 用 户 列表 > [RESTRICT | CASCADE] 
其 中 : RESTRICT 表示 只 收回 指定 用 户 的 权限 ， CASCADE 表示 收回 指定 用 户 及 其 授予 的 
其 他 用 户 的 该 权限 。 


8.6 创建 与 删除 触发 器 


触发 器 〈Trigger) 不 仅 能 实现 完整 性 规则 ， 而 且 能 保证 一 些 较 复杂 业务 规则 的 实施 。 对 于 
示警 或 满足 特定 条 件 下 自动 执行 某 项 任务 来 讲 ， 触 发 器 是 非常 有 用 的 机 制 。 所 谓 触发 器 就 是 一 


T 
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类 由 事件 驱动 的 特殊 过 程 ， 一 旦 由 某 个 用 户 定义 ， 任 何 用 户 对 该 触发 器 指定 的 数据 进行 增加 、 
删除 或 修改 操作 时 ， 系 统 将 自动 激活 相应 的 触发 器 ， 在 核心 层 进行 集中 的 完整 性 控制 。 

尽管 在 SQL-99 前 ， 触 发 器 不 是 SQL 标准 的 一 部 分 ， 但 是 以 SQL 为 基础 的 数据 库 广泛 应 
用 了 触发 器 。 但 是 ， 由 于 不 同 的 数据 库 系 统 使 用 各 自 的 触发 器 语法 ， 以 至 于 相互 之 间 不 兼容 的 
问题 。 


8.6.1 概述 


触发 器 是 一 种 特殊 类 型 的 存储 过 程 , 它 不 同 于 前 面 介绍 过 的 存储 过 程 ， 是 通过 事件 进行 触发 
而 被 执行 的 ， 而 存储 过 程 可 以 通过 存储 过 程 名 称 而 被 直接 调用 。 触 发 器 使 每 个 站 点 在 有 数据 修改 
时 自动 强制 执行 其 业务 规则 ， 并 且 可 以 用 于 SQL Server 约束 、 默 认 值 和 规则 的 完整 性 检查 。 

触发 器 主要 有 如 下 三 方面 的 特点 : 

(1) 当 数 据 库 程 序 员 声 明 的 事件 发 生 时 ， 触 发 器 被 激活 。 事 件 可 以 是 对 某 个 特定 关系 
的 插入 INSERT、 删 除 DELETE 或 更 新 UPDATE。 

(2) 当 触 发 器 被 事件 激活 时 ， 不 是 立即 执行 ， 而 是 首先 由 触发 器 测试 触发 条 件 ， 若 条 
件 不 成 立 ， 响 应 该 事件 的 触发 器 什么 事情 都 不 做 。 

(3) 如 果 触 发 器 声明 的 条 件 满足 ， 则 与 该 触发 器 相连 的 动作 由 DBMS 执行 。 动 作 可 以 
阻止 事件 发 生 ， 可 以 撤销 事件 。 

注意 : 触发 器 为 数据 库 对 象 ， 当 创建 一 个 触发 器 时 必须 指定 @ 名 称 ; @ 在 其 上 定义 触发 器 
的 表 ; @ 触 发 器 将 何 时 激发 ，@ 指 明 触 发 器 执行 时 应 做 的 动作 。 其 名 称 必须 遵循 标识 符 的 命名 
规则 ， 数 据 库 像 存储 普通 数据 那样 存储 触发 器 。 触 发 器 可 以 引用 当前 数据 库 以 外 的 对 象 ， 但 只 
能 在 当前 数据 库 中 创建 触发 器 。 尽 管 不 能 在 临时 表 或 系统 表 上 创建 触发 器 ， 但 是 触发 器 可 以 引 
用 临时 表 。 

触发 动作 实际 上 是 一 系列 SQL 语句 ， 可 以 有 两 种 方式 : 

(1) 对 被 事件 影响 的 每 一 行 (FOR EACH ROW) 一 一 每 一 元 组 执行 触发 过 程 ， 称 为 行 级 
触发 器 。 

(2) 对 整个 事件 只 执行 一 次 触发 过 程 (FOR EACH STATEMENT)， 称 为 语句 级 触发 器 。 
该 方式 是 触发 器 的 默认 方式 。 所 以 综合 触发 时 间 和 触发 方式 。 


8.6.2 ”创建 触发 器 


触发 器 的 定义 包括 两 个 方面 : 

(1) 指明 触发 器 的 触发 事件 ; 

(2) 指明 触发 器 执行 的 动作 。 

触发 事件 包括 表 中 行 的 插入 、 删 除 和 修改 ， 即 执行 INSERT、DELETE、UPDATE 语句 。 
在 修改 操作 (UPDATE) 中 ， 还 可 以 指定 ， 特 定 的 属性 或 属性 组 的 修改 为 触发 条 件 。 事 件 的 触 
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发 还 有 两 个 相关 的 时 间 : Before 和 After。Before 触发 器 是 在 事件 发 生 之 前 触发 ，After 触发 器 
是 在 事件 发 生 之 后 触发 。 创 建 触发 器 语句 格式 如 下 : 


CREATE TRIGGER< 触 发 器 名 > [ {BEFORE|AFTER} ] 
{ [DELETEIINSERTIUPDATEOF [ 列 名 清单 ]] } 
ON 表 名 
[REFERENCING 二 临时 视图 名 >] 
[WHEN 到 触发 条 件 >] 
BEGIN 
二 触发 动作 > 
END [触发 器 名 ] 

说 明 

(1) BEFORE: 指示 DBMS 在 执行 触发 语句 之 前 激发 触发 器 。 

(2) AFTER: 指示 DBMS 在 执行 触发 语句 之 后 激发 触发 器 。 

(3) DELETE: 指明 是 DELETE 触发 器 , 每 当 一 个 DELETE 语句 从 表 中 删除 一 行 时 激发 触 
发 器 。 

(4) INSERT: 指明 是 INSERT 触发 器 ， 每 当 一 个 INSERT 语句 向 表 中 插入 一 行 时 激发 触发 器 。 

(5) UPDATE: 指明 是 UPDATE 触发 器 , 每 当 UPDATE 语句 修改 由 OF 子 句 指定 的 列 值 时 ， 
激发 触发 器 。 如 果 忽 略 OF 子 句 ， 每 当 UDPATE 语句 修改 表 的 任何 列 值 时 ，DBMS 都 将 激发 触 
发 器 。 

(6) REFERENCING<< 临 时 视图 名 之 : 指定 临时 视图 的 别名 。 在 触发 器 运行 过 程 中 ， 系 统 
会 生成 两 个 临时 视图 ， 分 别 存放 被 更 新 值 ( 旧 值 》 和 更 新 后 的 值 ( 新 值 )。 对 于 行 级 触发 器 ， 
默认 临时 视图 名 分 别 是 OLD 和 NEW; 对 于 语句 级 触发 器 , 默认 临时 视图 名 分 别 是 OLD-TABLE 
和 NEW-TABLE。 一 旦 触发 器 运行 结束 ， 临 时 视图 就 不 在 了 。 

(7) WHEN<< 触 发 条 件 >: 指定 触发 器 的 触发 条 件 。 当 满足 触发 条 件 时 ，DBMS 才 激 发 触 
发 器 。 触 发 条 件 中 必须 包含 临时 视图 名 ， 不 包含 查询 。 

对 于 示警 或 满足 特定 条 件 下 自动 执行 某 项 任务 来 讲 ， 触 发 器 是 非常 有 用 的 机 制 。 假 设 银行 
处 理 透 支 时 ， 不 是 将 账户 户 余额 设置 成 负 值 ， 而 是 将 账户 余额 设置 成 零 ， 并 且 建 立 一 笔 贷款 ， 
其 金额 为 透支 额 。 这 笔 贷款 的 贷款 号 等 于 该 透支 账户 的 账户 号 。 这 样 执行 触发 器 的 条 件 是 对 关 


系 Account 更 新 导致 了 负 的 余额 。 
【 例 8.32】 假定 银行 数据 库 关系 模式 如 下 : 


Account (Account-no, branch-name, balance) 
Loan (Loan-no, branch-name, amount) 


depositor (customer-name, Account-no) 


EA 
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账户 关系 模式 Account 中 的 属性 Account-no 表示 账号 ，branch-name 表示 支行 名 称 ， 
balance 表示 余额 。 贷 款 关系 模式 Loan 中 的 属性 Loan-no 表示 贷款 号 ，branch-name 表示 文 
行 名 称 ，amount 表示 金额 。 存 款 关系 模式 depositor 中 的 属性 customer-name 表示 存款 人 姓 
名 。SQL-99 创建 触发 器 如 下 : 


CREATE TRIGGER overdraft trigger after update on Account 
Referencing new row as nrow 
For each row 
When nrow.balance<=0 
Begin atomic 
Insert into borrower 
(SELECT customer-name, Account-no 
FROM depositor 
Where nrow.account-no=depositor.account-no ); 
Insert into loan values 
(nrow.account-no,nrow.branch-name,-nrow.balance); 
update account set balance=0 


Where account.account-no=nrow.account-no 


End 


例 8.32 说 明 : 

When 语句 指定 一 个 条 件 nrow.balance<0。 仅 对 满足 条 件 的 元 组 才 会 执行 余下 的 触发 器 。 

Begin atomic…end 子 句 用 来 将 多 行 SQL 语句 集成 为 一 个 复合 语句 。 该 子 句 中 的 两 条 Insert 
into 语句 执行 了 在 borrower 和 loan 关系 中 建立 新 的 贷款 业务 ;update 语句 用 来 将 账户 余额 清 零 。 

Referencing old row as 子 句 可 以 建立 一 个 变量 用 来 存储 已 经 被 更 新 或 删除 行 的 旧 值 。 
Referencing new row as 子 句 可 以 被 update、Insert 语句 使 用 。 

Referencing old table as 或 Referencing new table as 子 句 可 以 用 来 指向 临时 表 (也 称 过 渡 表 ) 
来 容纳 所 有 被 影响 的 行 。 无 论 临时 表 是 语句 触发 器 还 是 行 触发 器 , 它们 都 不 能 用 before 触发 器 ， 
但 是 可 以 用 after 触发 器 。 
触发 器 事件 和 动作 可 以 有 很 多 形式 ， 除 了 update 以 外 还 可 以 是 Insert、delete。 例 如 ， 如 果 
有 一 个 新 的 用 户 存款 插入 时 ， 触 发 器 动作 可 以 给 用 户 发 一 封 欢迎 信 。 显 然 一 个 触发 器 不 能 直接 
对 数据 库 之 外 的 事情 进行 操作 ， 但 是 它 可 以 在 存储 待 发 欢迎 信 地 址 的 关系 中 添加 一 个 元 组 。 一 
个 专用 进程 会 检查 这 个 表 ， 打 印 出 要 发 出 的 欢迎 信 。 
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触发 器 在 事件 (update、Insert 和 delete) 之 前 被 激发 ， 而 不 是 在 事件 之 后 。 这 种 触发 器 器 


可 作为 避免 非法 更 新 的 额外 约束 。 例如， 有 时 用 户 不 允许 透支 ， 此 时 ， 可 以 建立 一 个 before 触 
发 器 在 新 的 余额 是 负数 时 回 滚 事务 。 


【 例 8.33】 仓库 管理 数据 库 中 有 如 下 关系 ， 请 创建 一 个 重新 订购 商品 的 触发 器 。 
inventory(item,level) ; 表示 某 种 商品 在 仓库 中 的 现 有 量 
minlevel(item,level) ; 表示 某 种 商品 在 仓库 中 存 有 的 最 小 量 
reorder(item,amount) ; 表示 某 种 商品 小 于 最 小 量 的 时 候 要 订购 的 数量 
orders(item,amount) ; 表示 某 种 商品 被 定购 的 量 


解 : 重新 订购 商品 的 触发 器 如 下 


CREATE TRIGGER reorder trigger after update of amount on inventory 


Referencing old row as orow,new row as nrow 
For each row 
When nrow.level= =(SELECT level 
FROM minlevel 
Where minlevel.item=orow.item) 
And orow.level> (SELECT level 
FROM minlevel 
Where minlevel.item=orow.item) 
Begin 
Insert into orders 
(SELECT item,amount 
FROM reorder 
Where reorder.item=orow.item) 
End 


8.6.3 更改 和 删除 触发 器 


1. 更 改 触发 器 
使 用 系统 命令 ALTER TRIGGER 更 改 指定 的 触发 器 的 定义 ， 即 更 改 原来 
TRIGGER 语句 创建 的 触发 器 定义 。 更 改 触发 器 定义 的 语法 格式 如 下 : 


ALTER TRIGGER< 触 发 器 名 > [ {BEFORE|AFTER}] 
{ [DELETEIINSERTIUPDATEOF [ 列 名 清单 ]] } 
ON 表 名 | 视图 名 


CREATE 
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AS 
BEGIN 
要 执行 的 SQL 语句 
END 
2. 删除 触发 器 
使 用 系统 命令 DROP TRIGGER 删除 指定 的 触发 器 ， 其 语法 格式 如 下 : 
DROP TRIGGER < 触发 器 名 > [ ,mn ] 


说 明 : n 表示 可 以 指定 多 个 触发 器 的 占 位 符 。 


8.7 ” 艇 入 式 SQL 


8.7.1 SQL 与 宿主 语言 接口 


SQL 提供 了 将 SQL 语句 嵌入 到 某 种 高 级 语言 中 的 使 用 方式 ， 但 是 如 何 识别 嵌入 在 高 级 语 
言 中 的 SQL 语句 。 通常 采用 预 编译 的 方法 。 该 方法 的 关键 问题 是 必须 区 分 主语 言 中 嵌入 的 SQL 
语句 ， 以 及 主语 言 和 SQL 间 的 通信 问题 。 采 用 的 方法 由 DBMS 的 预 处 理 程序 对 源 程序 进行 扫 
描 ， 识别 出 SQL 语句 ， 把 它们 转换 为 主语 言 调用 语句 ， 以 使 主语 言 编 译 程序 能 识别 它 ， 最 后 
主语 言 的 编译 程序 将 整个 源 程序 编译 成 目标 码 。 

可 见 将 SQL 媒 入 主语 言 使 用 时 应 当 注意 如 下 问题 。 

1. 区 分 主语 言语 句 与 SQL 语句 

为 了 区 分 主语 言语 句 与 SQL 语句 , 需要 在 所 有 的 SQL 语句 前 加 前 EXEC SQL ， 而 SQL 
的 结束 标志 随 主 语言 的 不 同 而 不 同 。 

例如 ，PL/1 和 C 语言 的 引用 格式 为 : 

EXEC SQL <SQL 语句 >; 
又 如 ，COBOL 语言 的 引用 格式 为 : 
EXEC SQL <SQL 语句 > END-EXEC 
2. 主语 言 工作 单元 与 数据 库 工作 单元 通信 


1) SQL 通信 区 
SQL 通信 区 (SQL Communication Area，SQLCA) 向 主语 言传 递 SQL 语句 执行 的 状态 信 
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息 ， 使 主语 言 能 够 根据 此 信息 控制 程序 流程 。 
2) 主 变量 
主 变量 也 称 共享 变量 。 主 语言 向 SQL 语句 提供 参数 主要 通过 主 变量 , 主 变 量 由 主语 言 的 程 
序 定义 ， 并 用 SQL 的 DECLARE 语句 说 明 。 例 如 在 C 语言 中 可 用 如 下 形式 说 明 主 变量 : 
EXEC SQL BEGIN DECLARE SECTION; 人 # 说 明 主 变量 /# 
char Msno[4],Mcno[3],givensno[5]; 
int Mgrade; 
char SQLSTATE[6]; 
EXEC SQL END DECLARE SECTION; 


上 面 五 行 组 成 一 个 说 明 节 ， 说 明了 五 个 共享 变量 ， 其 中 ，SQLSTATE 是 一 个 特殊 的 共享 变 
量 ， 起 着 解释 SQL 语句 执行 状况 的 作用 。 当 SQL 语句 执行 成 功 时 ， 系 统 自动 给 SQLSTATE 赋 
上 全 零 值 ， 否 则 为 非 全 零 (“02000”)。 因 此 ， 当 执行 一 条 SQL 语句 后 ， 可 以 根据 SQLSTATE 
的 值 转向 不 同 的 分 支 ， 以 控制 程序 的 流向 。 引 用 时 ， 为 了 与 SQL 属性 名 相 区 别 ， 需 在 主 变量 前 
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【 例 8.34】 根据 共享 变量 givensno 值 查询 学 生 关 系 students 中 学 生 的 姓名 、 年 龄 和 性 别 。 


EXEC SQL SELECT sname,age,sex 
INTO :Msno,:Mcno,:givensno 
FROM students 
WHERE sno=:Msno; 
【 例 8.35】 某 学 生 选 修了 一 门 课程 信息 , 将 其 插入 学 生 选 课表 SC 中 , 假设 学 号 、 课程 号 、 
成 绩 已 分 别 赋 给 主 变量 HSno、Hcno 和 Hgrade。 


EXEC SQL INSERT 
INTO SC (Sno, Cno, Grade) 
VALUES (:Hsno, :Hcno, :Hgrade); 


从 上 例 中 可 以 看 出 ，VALUES 子 句 中 通常 可 使 用 主 变量 传递 输入 数据 。 
3) 游标 
SQL 语言 是 面向 集合 的 ， 一 条 SQL 语句 可 产生 或 处 理 多 条 记录 。 而 主语 言 是 面向 记录 的 ， 
一 组 主 变 量 一 次 只 能 放 一 条 记录 ,所 以 , 引入 游标 , 通过 移动 游标 指针 来 决定 获取 哪 一 条 记录 。 
与 游标 相关 的 SQL 语句 有 四 条 : 
(1) 定义 游标 . 
定义 游标 的 格式 如 下 : 


E21 
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EXEC SQL DECLARE < 游标 名 > CURSOR FOR 
<SELECT 语句 > 


END EXEC 

这 是 一 条 说 明 性 语句 ， 定 义 中 的 SELECT 语句 并 不 立即 执行 。 
(2) 打开 游标 。 

打开 游标 的 格式 如 下 : 


EXEC SQL OPEN < 游标 名 > END_EXEC 
该 语句 执行 游标 定义 中 的 SELECT 语句 ， 同 时 游标 处 于 活动 状况 。 游 标 是 一 个 指针 ， 此 时 
指向 查询 结果 的 第 一 行 之 前 。 
(3) 推进 游标 。 
推进 游标 的 格式 如 下 : 


EXEC SQL FETCH FROM < 游标 名 > INTO < 变量 表 > END_EXEC 


该 语句 使 用 时 ， 游 标 推进 一 行 ， 并 把 游标 指向 的 行 〈 称 为 当前 行 ) 中 的 值 取出 ， 送 到 共享 
变量 中 。 变 量 表 是 用 逗号 分 开 的 # 


共享 变量 组 成 。 该 语句 常 置 于 宿主 语言 程序 的 循环 结构 中 ， 并 
借助 宿主 语言 的 处 理 语句 逐一 处 理 查询 结果 中 的 一 个 元 组 。 
(4) 关闭 游标 。 


关闭 游标 的 格式 如 下 : 
EXEC SQL CLOSE < 游标 名 > END_EXEC 


该 语句 关闭 游标 ， 使 它 不 再 和 查询 结果 相 联系 。 关 闭 了 的 游标 ， 可 以 再 次 打开 ， 与 新 的 查 
询 结果 相 联系 。 在 游标 处 于 活动 状态 时 ， 可 以 修改 和 删除 游标 指向 的 元 组 。 

【 例 8.36】 在 C 语言 中 嵌入 SQL 的 查询 ， 检 索 某 学 生 的 学 习 成 绩 ， 其 学 号 由 共享 主 变量 
givensno 给 出 ， 结 果 放 在 主 变 量 Sno,Cno,Grade 中 。 如 果 成 绩 不 及 格 ， 则 删除 该 记录 ， 如 果 成 
绩 在 


E 60~69 分 之 间 ， 则 将 成 绩 修改 为 70 分 ， 并 显示 学 生 的 成 绩 信息 《 除 60 分 以 下 的 )。 
解 : 


#DEFINE NO_MORE _TUPLES !(stremp(SQLSTATE,"02000")) 
void sel() 


{EXEC SQL BEGIN DECLARE SECTION; 
char Msno[4],Mcno[3],givensno[5]; 
int Mgrade; 
char SQLSTATE[6]; 


证 说 明 主 变量 /* 
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EXEC SQL END DECLARE SECTION; 


EXEC SQL DECLARE Scx CURSOR FOR /# 说明 游标 Sox， 将 查询 结 /# 
SELECT Sno,Cno,Grade /#* 果 与 Sex 建立 联系 /* 
FROM SC 
WHERE Sno=:givensno; 

EXEC SQL OPEN Scx; 

While(1) 人 # 用 循环 结构 逐条 处 理 结果 集中 的 记录 /# 

{EXEC SQLFETCH FROM Scx /# 游 标 推进 一 行 产 

INTO :Msno,:Mcno,:Mgrade; 上 * 送 入 主 变量 /* 

If (NO_MORE _ TUPLES) Break:; 人 # 处 理 完 退 出 循环 人 # 

If (Mgrade<60) /# 成 绩 <60/* 

EXEC SQL DELETE FROM Sc 
WHERE CURRENT OF Scx; 
Else 
{ If (Mgrade<70) 片 成 绩 <70/* 
EXEC SQL UPDATE Se 

SET grade=70 

WHERE CURRENT OF Scx; 

MGrade=70 


} 
Printf(**%s,%s,%d”, Msno, Mcno, Mgrade); 旋 显 示 学 生 记 录 /* 


}; 
8.7.2 动态 SQL 

SQL 的 动态 SQL 组 件 允 许 程序 在 运行 时 构造 、 提 交 SQL 查询 。 与 此 相反 , 嵌入 式 SQL 语 
句 必须 在 编译 时 完全 确定 ， 由 预 处 理 程序 预 编译 和 宿主 语言 编译 程序 编译 。 也 就 是 说 ， 在 实际 
使 用 时 ， 源 程序 往往 不 能 包括 用 户 的 所 有 操作 ， 用 户 对 数据 库 的 操作 有 时 往往 在 实际 运行 时 才 
提出 请 求 ， 为 此 需要 采用 SQL 的 动态 技术 。 动 态 SQL 有 两 条 语句 : 

1) 动态 SQL 预备 语句 格式 

EXEC SQL PREPARE < 动态 SQL 语句 名 > FROM < 共享 变量 或 字符 串 >; 


此 处 共享 变量 或 字符 串 应 该 是 一 个 完整 的 SQL 语句 。 这 个 SQL 语句 可 以 在 程序 运行 时 
用 户 输入 才 组 合 起 来 ， 但 并 不 执行 。 
2) 动态 SQL 执行 语句 格式 


EXEC SQL EXECUTE < 动态 SQL 语句 名 >; 
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使 用 动态 SQL 语句 时 ， 还 可 以 改进 技术 : 
当 预 备 语句 组 合 而 成 的 SQL 语句 只 需 执行 一 次 , 那么 预备 语句 可 以 在 程序 运行 时 由 用 户 输 
入 才 组 合 起 来 ， 但 并 不 执行 。 


8.8 SQL-99 所 支持 的 对 象 关系 模型 


对 象 -关系 数据 模型 扩展 关系 数据 模型 的 方式 是 通过 提供 一 个 包括 复杂 数据 类 型 和 面向 对 
象 的 更 丰富 的 类 型 系统 。 关 系 查 询 语言 (特别 在 SQL 中 ) 需要 做 相应 扩展 以 处 理 这 些 更 丰富 的 
类 型 系统 。 这 种 扩展 试图 在 扩展 建 模 能 力 的 同时 保留 关系 的 基础 一 特别 是 对 数据 的 说 明 性 存 
取 。 对 象 -关系 数据 库 系统 是 以 对 象 -关系 模型 为 基础 的 数据 库 系统 。 


8.8.1 谋 套 关系 


前 面 定义 的 第 一 范式 〈1NF) 是 指 关 系 模 式 中 的 属性 是 不 可 再 分 的 ， 即 是 原子 的 。 然 而 ， 
并 不 是 所 有 的 应 用 都 是 用 1NF 建 模 最 好 。 例 如 ， 某 些 应 用 的 用 户 将 数据 库 视 为 对 象 〈 或 实体 ) 
的 一 个 集合 ， 而 不 是 记录 的 一 个 集合 ， 这 些 对 象 可 能 需要 若干 条 记录 来 表示 。 重 要 的 是 ， 如 何 
在 一 个 简单 、 易 用 的 界面 上 体现 用 户 直 观 概念 上 的 一 个 对 象 与 数据 库 系 统 概念 上 的 一 个 数据 项 
之 间 的 一 一 对 应 关系 。 

嵌 套 关系 模型 (Nested Relational Model) 是 关系 模型 的 一 个 扩展 ， 域 可 以 是 原子 的 也 可 以 
赋值 为 关系 。 这 样 元 组 在 一 个 属性 上 的 取 值 可 以 是 一 个 关系 ， 于 是 关系 可 以 存储 在 关系 中 。 从 
而 一 个 复杂 对 象 就 可 以 用 媒 套 关系 的 单个 元 组 来 表示 。 如 果 我 们 将 嵌 套 关系 的 一 个 元 组 视 为 一 
个 数据 项 ， 在 数据 项 和 用 户 数 据 库 观念 上 的 对 象 之 间 就 有 了 一 个 一 一 对 应 的 关系 。 

下 面 通过 一 个 图 书馆 的 例子 来 说 明 风 套 关系 。 假 定 对 每 本 书 存储 如 下 信息 : 

如 果 为 上 面 这 些 信息 定义 一 个 关系 ， 下 列 一 些 域 将 是 非 原子 的 : 

(1) 作者 。 一 本 书 可 能 有 一 组 作者 ， 然 而 ， 我 们 可 能 想 要 寻找 作者 之 一 是 Jones 的 所 有 书 ， 
这 样 我 们 就 对 域 元 素 “作者 集合 ”的 一 个 子 部 分 感 兴趣 。 

(2) 关键 字 。 如 果 我 们 为 一 本 书 存储 了 一 组 关键 字 ， 我 们 希望 能 够 检索 出 关键 字 包含 该 集 
合 中 的 一 个 或 多 个 关键 字 的 所 有 书 ， 这 样 ， 我 们 就 将 关键 字 集合 域 视 为 非 原 子 的 。 

(3) 出 版 商 。 与 关键 字 和 作者 不 同 ， 出 版 商 没有 一 个 以 集合 为 值 的 域 。 但 是 ， 我 们 可 能 将 
出 版 商 视 为 由 名 字 和 分 支 机 构 这 两 个 子 字 段 组 成 的 ， 这 种 观念 使 得 出 版 商 域 成 为 非 原 子 的 。 

8-2 表示 了 一 个 示例 关系 books，books 关系 可 以 用 1NF 表示 ， 如 图 8-3 所 示 。 由 于 在 
1NF 中 我 们 只 能 有 原子 的 域 , 然而 我 们 又 想 要 访问 单个 的 作者 和 单个 的 关键 字 , 我 们 对 每 个 ( 关 
键 字 ， 作 者 ) 对 都 需要 一 个 元 组 ， 出 版 商 属性 在 1NF 版 本 中 被 两 个 属性 所 取代 : 它们 分 别 对 应 
于 出 版 商 的 每 个 子 字段 。 
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Title Author-set publisher(name, branch) keyword-set 


Compilers {Smith, Jones} (McGraw-Hill, New York) {parsing, analysis} 


Networks {Jones, Frick} (Oxford, London) {Internet, Web} 
图 8-2 非 INF 的 书籍 关系 ，books 


title pub-name pub-branch keywork 
Compilers McGraw-Hill New York Parsing 
Compilers McGraw-Hill New York Parsing 
Compilers McGraw-Hill New York Analysis 
Compilers McGraw-Hill New York Analysis 
Networks Oxford London Internet 
Networks Oxford London Internet 
Networks Oxford London Web 
Networks Oxford London Web 


图 8-3 flat-books 的 一 个 1NF 实例 


如 果 假 定 下 列 多 值 依赖 成 立 : 

e title 一 一 author 

e title 一 一 keyword 

e。 title 一 pub-name, pub-branch 

我 们 可 以 使 用 下 面 的 模式 将 这 个 关系 分 解 成 4NF, 使 得 图 8-3 中 flat-books 关系 的 匈 余 就 可 
以 去 除 。 图 8-4 显示 了 图 8-3 中 的 flat-books 关系 到 上 述 分 解 的 映射 。 

e authors(title, author) 

® keywords(title, keyword) 

® books4(title, pub-name, pub-branch) 


title author title Keyword 
Compilers Smith Compilers parsing 
Compilers Jones Compilers analysis 
Networks Jones Networks Internet 
Networks Frick Networks Web 
authors keywords 
Title pub-name pub-branch 
Compilers McGraw-Hill New York 
Networks Oxford London 
books4 
图 8-4 分解 关系 flat-books 为 4NF 的 实例 


是?"% 医 
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尽管 不 用 嵌 套 关系 也 足以 表达 上 述 示例 书籍 数据 库 , 但 是 嵌 套 关系 可 以 产生 一 个 更 易 理解 的 
模型 : 一 个 信息 检索 系统 的 典型 用 户 根据 具有 作者 集 的 书 将 该 数据 库 看 成 一 个 非 INF 的 设计 模 
型 。4NF 设计 会 要 求 用 户 在 他 们 的 查询 中 包含 连接 操作 ， 因 此 使 得 与 系统 的 交互 复杂 化 。 


我 们 可 以 设计 一 个 无 嵌 套 的 关系 视图 〈 它 的 内 容 与 flat-books 一 样 ) 来 免除 用 户 在 他 们 的 查 


询 中 编写 连接 操作 的 需要 ， 然 而 在 这 样 的 视图 中 ， 我 们 却 失去 了 元 组 与 书 之 间 的 一 对 一 的 对 应 。 


面 


理 者 ， 


向 对 象 数据 库 系统 支持 面向 对 象 数据 模型 ， 是 一 个 持久 的 、 可 共享 的 对 象 库 的 存储 和 管 


而 一 个 对 象 库 是 由 一 个 OO 模型 所 定义 的 对 象 的 集合 体 。 
象 : 是 由 一 组 数据 结构 和 在 这 组 数据 结构 上 的 操作 的 程序 代码 封装 起 来 的 基本 单位 。 对 


象 之 间 的 界面 由 一 组 消息 定义 。 一 个 对 象 包括 : 属性 集合 、 方 法 集合 和 消息 集合 。 


对 


象 标识 : 是 指 面向 对 象 数据 库 中 的 每 个 对 象 都 有 一 个 唯一 不 变 的 标识 。 常 用 的 几 种 标识 


有 值 标识 、 名 标识 和 内 标识 。 


值 标识 ， 使 用 一 个 值 来 标识 ， 在 关系 数据 库 中 通常 使 用 这 种 形式 的 标识 。 例 如 ， 
一 个 元 组 的 主 码 标识 了 这 个 元 组 。 

名 标识 ， 用 用 户 提供 的 名 称 作为 标识 。 这 种 形式 的 标识 通常 用 于 文件 系统 中 的 文 
件 ， 不 管 文件 的 内 容 是 什么 ， 每 个 文件 都 被 赋予 一 个 名 称 来 唯一 标识 。 

内 标识 ， 是 建立 在 数据 模型 或 程序 设计 语言 中 内 置 的 一 种 标识 ， 不 需要 用 户 给 出 
标识 。 面 向 对 象 系统 中 使 用 这 种 形式 的 标识 ， 每 个 对 象 在 创建 时 被 系统 自动 赋予 


一 个 标识 符 。 


封装 : OO 模型 的 一 个 关键 概念 就 是 封装 。 每 一 个 对 象 是 其 状态 和 行为 的 封装 。 封 装 是 对 
象 的 外 部 界面 与 内 部 实现 之 间 实 行 清 晰 隔离 的 一 种 抽象 ， 外 部 与 对 象 的 通信 只 能 通过 消息 。 

类 : 共享 同样 属性 和 方法 集 的 所 有 对 象 构成 了 一 个 对 象 类 〈 简 称 类 )。 例 如 ， 学 生 是 一 个 
类 ， 黎 明 、 张 军 、 樊 建 豆 是 学 生 类 中 的 一 个 对 象 。 类 是 “型 ”， 对 象 是 “ 值 ”。 


8.8.2 


复杂 类 型 


典 套 关系 只 是 对 基本 关系 模型 扩展 的 一 个 实例 ， 其 他 非 原子 数据 类 型 ， 如 内 套 记录 ， 同 样 
已 被 证 明 是 有 用 的 。 面 向 对 象 数据 模型 已 经 导致 了 对 于 诸如 对 和 象 的 继承 和 引用 之 类 特征 的 需 
求 。 有 了 复杂 对 象 系统 和 面向 对 象 ， 我 们 能 够 直接 表达 E-R 模型 的 一 些 概念 ， 如 实体 标识 、 多 


值 属性 及 一 般 化 和 特殊 化 ， 而 不 再 需要 经 过 到 关系 模型 的 复杂 转化 。 


在 本 节 中 , 通过 描述 为 允许 复杂 类 型 对 SQL 所 做 的 扩展 ,包括 霸 套 关系 以 及 面向 对 象 特 征 。 
我 们 的 介绍 是 基于 SQL-99 标准 的 一 些 特征 。 


bE 


集合 类 型 


考虑 下 面 这 个 代码 段 : 
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create table books( 


keyword-set setof(varchar(20)) 


) 

这 个 表 的 定义 不 同 于 普通 关系 数据 库 中 表 的 定义 , 因为 它 允 许 属性 是 集合 (Set), 所 以 E-R 

图 中 的 多 值 属性 能 够 直接 表示 。 
合 是 集合 体 类 型 (Collection Type) 的 一 个 实例 ， 其 他 的 集合 体 类 型 包括 数组 〈Array) 

和 多 重 集合 (Multiset)〈 即 无 序 的 集合 体 ， 其 中 一 个 元 素 可 以 出 现 多 次 )， 下 面 的 属性 定义 了 数 
组 的 声明 : 

author-array varchar(20) array [10] 

这 里 author-array 是 最 多 10 位 作者 名 的 数组 ， 我 们 可 以 通过 指定 数组 下 标 来 访问 数组 中 的 
元 素 ， 例 如 authorarray[1]、authorarray[2]、…、author-array[10]。 数 组 是 SQL-99 中 唯一 支持 
的 集合 体 类 型 ， 使 用 语法 如 前 所 述 。SQL-99 不 支持 无 序 集合 或 多 重 集合 ， 尽 管 它 们 可 能 会 在 
SQL 将 来 的 版 本 中 出 现 。 

许多 现在 的 数据 库 应 用 需要 存储 的 属性 很 大 〈 大 约 几 K 字 节 )， 比 如 一 个 人 的 相片 ， 或 者 
更 大 的 (大 约 几 M 甚至 上 G 字 节 )， 比 如 高 分 辩 率 的 医学 图 像 或 者 录像 剪辑 。 因 此 SQL-99 提 
供 了 新 字符 型 数据 大 对 象 数据 类 型 (Clob) 和 二 进 制 数据 大 对 象 数据 类 型 (Blob)。 数 据 类 型 中 
的 “lob” 意 为 “Large Object”。 例如 ， 声 明 属性 : 


book-review clob(10KB) 

image blob(10MB) 

movie blob(2GB) 

执行 一 个 SQL 查询 通常 把 结果 中 的 一 条 或 多 条 记录 放 入 内 存 。 大 对 和 象 一 般 用 于 外 部 的 应 用 ， 

把 整个 大 对 象 〈 几 M 甚至 上 G 字 节 ) 放 入 内 存 中 是 非常 低 效 和 不 现实 的 。 即 通过 SQL 对 它们 进 
行 全 体检 索 是 毫 无 意义 的 ， 取 而 代 之 ， 应 用 程序 一 般 用 一 个 SQL 查询 来 检索 大 对 象 的 “定位 器 ”， 
然后 用 定位 器 从 宿主 语言 中 一 点 一 点 地 操作 该 对 象 。 例 如 ，JDBC 允许 程序 员 分 成 小 片 来 存 取 一 个 
大 对 象 ， 而 不 是 一 次 全 取出 来 ， 很 像 从 操作 系统 文件 中 存 取 数据 。 


2. 结构 类 型 


在 SQL-99 中 结构 类 型 声明 以 及 使 用 方法 如 下 例 所 示 。 

【 例 8.37】 定义 一 个 Publisher 类 型 ， 包括 : 名 字 (name) 和 分 支 机 构 (branch) 两 个 部 分 。 
定义 一 个 结构 类 型 Book， 包 含 : 标题 (title)、 作 者 数组 (author-array)、 出 版 时 间 (pub-date)、 
出 版 商 (publisher， 是 Publisher 类 型 的 ) 和 一 个 关键 字 集 合 (keyword-set 作为 集合 的 声明 使 用 
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了 扩展 语法 ， 在 SQL-99 标准 中 并 不 支持 。)。 
create type Publisher as 
(name varchar(20), 
branch varchar(20)) 
create type Book as 
(title varchar(20), 
author-array varchar(20) array [10], 


pub-date date, 

publisher Publisher, 

keyword-set setof(varchar(20))) 
create tabel books of Book 


最 后 ,创建 了 一 个 包含 Book 类 型 元 组 的 表 books, 这 个 表 类 似 于 图 8-2 中 的 顽 套 关系 books， 
创建 一 个 作者 名 的 数组 以 代替 作者 名 的 集合 ， 数 组 允许 记录 作者 名 的 顺序 。E-R 图 中 的 复合 属 
性 可 以 用 结构 类 型 直接 表达 。 在 SQL-99 中 ,无 名 称 的 行 类 型 (Row Type) 用 来 定义 复合 属性 。 

【 例 8.38】 可 以 定义 属性 publisherl 为 无 名 称 的 行 类 型 。 


publisherl row(name varchar(20), 
branch varchar(20)) 


需要 说 明 的 是 ， 例 8.37 中 ，books 表 创 建 一 个 中 间 类 型 book， 事 实 上 ， 也 可 以 不 创建 中 间 
类 型 直接 将 books 表 定 义 如 下 : 


create type Publisher as 
(name varchar(20), 
branch varchar(20)) 
create table books 
(title varchar(20), 
author-array varchar(20) array[10], 


pub-date date, 
publisher Publisher, 
keyword-set setof(varchar(20))) 
使 用 上 述 声明 , 没有 该 表 的 行 的 明确 类 型 ,结构 类 型 还 可 以 有 定义 在 其 上 的 方法 (Method)。 
我 们 将 方法 的 声明 作为 一 个 结构 类 型 的 类 型 定义 的 一 部 分 : 
create type Employee as( 
name varchar(20), 
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salary integer) 
method giveraise (percent integer) 


我 们 单独 创建 方法 的 主体 : 


create method giveraise (percent integer) for Employee 


begin 
set self.salary=self.salary+(self.salary*percent)/100; 
end 


变量 self 是 指 调用 这 个 方法 的 结构 类 型 的 实例 。 方 法 的 主体 可 以 包含 过 程 语句。 
3. 复杂 类 型 值 的 创建 


在 SQL-99 中 构造 器 函数 (Constructor Function ) 用 来 创建 结构 类 型 的 值 。 与 结构 类 型 同名 
的 函数 就 是 这 个 结构 类 型 的 构造 器 函数 。 
【 例 8.39】 给 Publisher 类 型 声明 一 个 构造 器 : 


create function Publisher (n varchar(20), b varchar(20)) 
returns Publisher 
begin 
set name=n; 
set branch=b; 
end 


然后 我 们 可 以 用 Publisher(McGraw-Hill,, "New York') 来 创建 Publisher 类 型 的 值 。 

SQL-99 也 支持 除 构造 器 之 外 的 其 他 函数 。 这 些 函 数 的 名 字 必 须 不 同 于 任何 结构 类 型 的 名 
字 。 注 意 在 SQL-99 中 ， 不 像 在 面向 对 象 数据 库 中 ， 构 造 器 创建 的 是 类 型 的 一 个 值 ， 而 不 是 类 
型 的 一 个 对 象 。 也 就 是 说 ， 构 造 器 创建 的 值 没有 对 象 标识 。 在 SQL-99 中 对 象 相 当 于 关系 中 的 
元 组 ， 通 过 在 关系 中 插入 一 个 元 组 来 创建 。 

默认 的 情况 下 ， 每 一 个 结构 类 型 都 有 一 个 不 带 参数 的 构造 器 ， 它 将 属性 设 为 默认 值 。 任 何 
其 他 的 构造 器 必须 被 显 式 地 创建 。 对 同一 个 结构 类 型 可 以 有 不 止 一 个 构造 器 ， 虽 然 它们 有 一 个 
相同 的 名 字 ， 但 是 它们 必须 以 参数 的 个 数 和 类 型 来 相互 区 别 。 

在 SQL-99 中 可 以 这 样 创建 数组 的 值 : 


array["Silberschatz', Korth', 'Sudarshan'] 


我 们 可 以 在 圆 括号 中 列 出 它 的 属性 来 构造 一 行 的 值 。 例 如 ， 我 们 声明 Publisherl 属性 为 一 
个 行 类 型 ， 我 们 可 以 这 样 构造 它 的 值 : 


3" 攻 
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(McGraw-Hill'，New York) 
它 没 有 用 到 构造 器 。 
通过 在 关键 字 set 之 后 的 圆 括号 内 列举 它 的 元 素 的 方法 创建 以 集合 为 值 的 属性 ， 例 如 
keyword-set。 可 以 像 集合 值 一 样 创建 多 重 集合 值 ， 此 时 只 需要 用 multiset 替换 set。 
可 以 创建 用 一 个 books 关系 定义 的 类 型 的 一 个 元 组 如 下 : 


(‘Compilers', array['Smith', "Jones'], Publisher(McGraw-Hill', 'New York'), 
set('parsing', 'analysis)) 
这 里 通过 合适 参数 调用 Publisher 的 构造 器 函数 创建 了 Publisher 属性 的 值 。 如 果 想 在 books 
关系 中 插入 上 述 元 组 ， 可 以 执行 语句 


insert into books 


values 
(‘Compilers', array['Smith', 'Jones'], Publisher(McGraw-Hill'，New York )， 
set('parsing', 'analysis)) 


8.8.3 继承 
继承 可 以 在 类 型 的 级 别 上 进行 ， 也 可 以 在 表 级 别 上 进行 ， 下 面 分 别 介绍 。 
1.， 类 型 继承 


若 希 望 在 数据 库 中 对 那些 是 学 生 和 教师 的 人 分 别 存储 一 些 额外 的 信息 。 
【 例 8.40】 假定 人 的 类 型 定义 如 下 所 示 ， 定 义学 生 和 教师 类 型 。 


create type Person 
(name varchar(20), 
address varchar(20)) 


由 于 学 生 和 教师 是 人 ， 所 以 可 以 使 用 继承 。 在 SQL-99 中 定义 学 生 和 教师 类 型 如 下 : 


create type Student 
under Person 
(degree varchar(20), 
department varchar(20)) 
create type Teacher 


under Person 
(salary integer, 
department varchar(20)) 


第 8 章 SQL 语言 


Student 和 Teacher 都 继承 了 Person 的 属性 ， 即 name 和 address。Student 和 Teacher 被 称 为 
Person 的 子 类 型 ，Person 是 Student 的 超 类 型 ， 同 时 也 是 Teacher 的 超 类 型 。 像 属性 一 样 ， 结 构 
类 型 的 方法 也 被 它 的 子 类 型 继承 。 不 过 ， 子 类 型 可 以 通过 在 一 个 方法 声明 中 使 用 overriding 
method〈 重 载 方法 ) 取代 原 method (方法 ) 的 方式 重新 声明 方法 ， 以 重 定义 该 方法 的 作用 。 

现在 假定 要 存储 关于 助教 的 信息 , 这 些 助教 既是 学 生 又 是 教师 , 甚至 可 能 是 在 不 同 的 系 里 。 
可 以 利用 多 重 继承 (Multiple Inheritance ) 的 方法 来 做 .SQL-99 标准 不 支持 多 重 继承 , 然而 SQL-99 
标准 是 提供 多 重 继承 的 ， 尽 管 SQL-99 最 终 版 中 忽略 了 它 ， 但 SQL 标准 的 未 来 版 本 可 能 会 引入 
它 。 基 于 SQL-99 标准 的 草案 来 讨论 问题 。 

【 例 8.41】 假定 类 型 系统 支持 多 重 继承 ， 那 么 可 以 为 助教 定义 一 个 类 型 如 下 : 


create type TeachingAssistant 
under Student, Teacher 


TeacherAssistant 将 继承 Student 和 Teacher 的 所 有 属性 。 由 于 Name 和 address 属性 实际 上 
是 从 同一 个 来 源 即 Person 继承 来 的 , 因此 同时 从 Student 和 Teacher 中 都 继承 这 两 个 属性 不 会 
起 冲突 。 但 是 ， 一 个 助教 既 可 能 是 某 个 系 的 学 生 同 时 又 是 另 一 个 系 的 教师 ， 所 以 department 
性 在 Student 和 Teacher 中 分 别 都 有 定义 。 为 了 避免 两 次 出 现 的 department 之 间 的 冲突 ， 我 们 可 
以 使 用 as 子 句 将 它们 重新 命名 ， 如 下 面 的 TeachingAssistant 类 型 定义 所 示 : 


Create type TeachingAssistant 
Under Student with(department as student-dept), 
Teacher with(department as teacher-dept) 


注意 SQL-99 只 支持 单 继承 ， 即 一 个 类 型 只 能 继承 一 种 类 型 ， 使 用 的 语法 如 例 8.38。 
TeachingAssistant 例子 中 的 多 重 继承 在 SQL-99 中 是 不 支持 的 。SQL-99 标准 还 需要 在 类 型 定义 
的 尾部 有 一 个 特别 的 字段 ， 取 值 为 final 或 not final。 其 中 ， 关 键 字 final 表示 不 能 从 给 定 类 型 创 
建 子 类 型 ，not final 表示 可 以 创建 子 类 型 。 

SQL 中 的 一 个 结构 类 型 的 值 必须 恰好 只 有 一 个 “最 明确 类 型 (most-specific type)”， 即 每 
一 个 值 被 创建 时 必须 关联 到 一 个 确定 的 类 型 ， 称 为 它 的 最 明确 类 型 。 依 靠 继承 ， 它 也 与 它 的 最 
明确 类 型 的 每 个 超 类 型 相关 联 。 举 例 来 说 ， 假 定 一 个 实体 具有 类 型 Person， 同 时 又 具有 类 型 
Student， 那 么 这 个 实体 的 最 明确 类 型 为 Student， 因 为 Student 是 Person 的 子 类 型 。 然 而 一 个 实 
体 不 能 同时 既 具 有 类 型 Student 又 具有 类 型 Teacher， 除 非 这 个 实体 具有 一 个 如 TeacherAssistant 
那样 既是 Student 子 类 型 又 是 Teacher 的 子 类 型 的 类 型 。 


2. 表 继 承 


SQL-99 中 的 子 表 (Subtable) 对 应 的 是 E-R 概念 中 的 特殊 化 /一 般 化 。 子 表 的 类 型 必须 是 
父 表 类 型 的 子 类 型 ， 因 此 ， 父 表 中 的 每 一 个 属性 均 出 现在 子 表 中 。 


oa 
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【 例 8.42】 假 设 People 表 的 定义 如 下 ， 定 义 people 的 两 个 子 表 : students 和 teachers。 
create table people of Person 
定义 子 表 students 和 teachers 如 下 : 


create table students of Student 
under people 

create table teachers of Teacher 
under people 


当 我 们 声明 students 和 teachers 作为 people 的 子 表 时 , 每 一 个 students 或 teachers 中 出 现 的 
元 组 也 隐 式 存在 于 people 中 。 如 果 一 个 查询 用 到 people 表 , 它 将 查找 的 不 仅仅 是 直接 插入 到 这 
个 表 中 的 元 组 ， 而 且 还 包含 插入 到 它 的 子 表 (也 就 是 students 和 teachers) 中 的 元 组 。 但 是 ， 只 
有 出 现在 people 中 的 属性 才 可 以 被 访问 。 

多 重 继 承 也 可 在 表 进 行 。 例 如 ， 创 建 一 个 类 型 为 TeachingAssistant 的 表 : 


create table teaching-assistants of TeachingAssistant 
under students, teachers 


作为 声明 的 结果 ， 每 一 个 在 teaching-assistants 中 出 现 的 元 组 也 隐 式 地 在 表 teachers 和 
students 中 出 现 , 从 而 也 出 现在 people 表 中 。SQL-99 允许 在 查询 中 使 用 “only people” 代 替 people 
来 查询 只 在 people 中 而 不 在 它 的 子 表 中 的 元 组 。 

对 子 表 的 一 致 性 要 求 。 如 果 一 个 子 表 和 一 个 父 表 中 的 元 组 对 于 所 有 的 继承 属性 具有 
值 ， 则 称 子 表 中 的 元 组 符合 (Correspond to) 父 表 中 的 元 组 。 因 此 ， 相 符合 的 元 组 表示 
实体 。 子 表 的 一 致 性 需求 为 : 

。 ” 父 表 的 每 个 元 组 至 多 可 以 与 它 的 每 个 直接 子 表 的 一 个 元 组 符合 。 

。 ”SQL-99 有 一 个 附加 的 约束 ， 所 有 相符 合 的 元 组 必须 由 一 个 元 组 派生 (插入 到 一 个 表 中 )。 
例如 ， 若 没有 第 一 个 条 件 ， 我 们 就 可 能 在 students (或 teachers) 中 有 两 个 元 组 与 同一 个 人 
符合 。 第 二 个 条 件 排除 了 people 中 的 一 个 元 组 分 别 符合 students 和 teachers 中 的 一 个 元 组 的 情 
况 , 除非 所 有 这 些 元 组 都 隐 式 出 现 。 这 是 由 于 一 个 元 组 会 被 插入 到 一 个 既是 teacher 的 子 表 又 是 
students 的 子 表 的 teaching-assistants 表 中 。 

于 SQL-99 不 支持 多 重 继承 ， 所 以 第 二 个 条 件 实际 上 阻止 一 个 人 既是 老师 又 是 学 生 。 即 
使 支持 多 重 继承 ， 这 个 问题 在 没有 子 表 teaching-assistants 时 也 会 出 现 。 显 然 ， 建 立 一 个 即使 没 
有 teaching-assistants 子 表 也 可 以 让 一 个 人 既是 老师 又 是 学 生 的 环境 是 很 有 用 的 。 因 此 ， 去 掉 第 
二 个 一 致 性 约束 是 有 用 的 。 
子 表 可 以 采用 无 须 复制 所 有 的 继承 字段 的 有 效 方式 进行 存储 ， 通 常 有 如 下 两 种 方式 : 
。 每 一 个 表 只 存储 主 码 〈 可 能 是 从 父 表 中 继承 来 的 ) 和 局 部 定义 的 属性 。 继 承 属 性 〈3 


样 的 


一 个 


下 本 


FT 
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码 之 外 的 ) 不 需要 存储 ， 因 为 它 可 以 基于 主 码 与 父 表 连 接 得 到 。 

。 每 一 个 表 存 储 所 有 继承 的 和 局 部 定义 的 属性 。 当 插入 一 个 元 组 时 ， 它 仅仅 存储 在 它 被 
插入 的 那个 表 中 ， 在 它 的 每 个 父 表 中 推断 它 的 出 现 。 因 为 不 需要 连接 ， 所 以 可 快速 访问 元 
组 的 所 有 属性 。 不 过 ， 一 旦 没有 第 二 个 一 致 性 约束 〈 即 一 个 实体 可 能 出 现在 两 个 子 表 中 而 
不 在 它们 的 公共 子 表 中 出 现 )， 这 种 表达 将 导致 信息 重复 的 问题 。 


8.8.4 引用 类 型 


面向 对 象 的 程序 设计 语言 提供 了 引用 对 象 的 能 力 ， 类 型 的 一 个 属性 可 以 是 对 一 个 指定 类 型 
的 对 象 的 引用 。 
【 例 8.43】 定义 一 个 包括 name 字段 和 head 字段 的 Department 类 型 ， 一 个 Department 类 
型 的 表 departments。 其 中 ，head 字段 引用 到 Person 类 型 。 方 法 如 下 所 示 : 
create type Department( 
name varchar(20), 
head ref(Person) scope people) 
create table departments of Department 
这 里 ， 引 用 限制 在 people 表 中 的 元 组 。 在 SQL-99 中 ， 对 一 个 指向 表 的 元 组 的 引用 的 范围 
(Scope) 的 限制 是 强制 的 ， 它 使 引用 的 行为 与 外 码 类 似 。 


8.8.5 与 复杂 类 型 有 关 的 查询 
复杂 类 型 的 SQL 查询 语言 扩展 从 一 个 简单 的 例子 来 说 明 。 例如， 找 出 每 本 书 的 标题 和 出 版 
商 。 下 面 的 查询 实现 了 这 项 任务 : 


select title, publisher.name 
from books 


请 注意 我 们 使 用 点 号 “.” 引 用 了 复合 属性 publisher 的 name 字段 。 
1. 路 径 表 达 式 
在 SQL-99 中 对 引用 取 内 容 使 用 3》 符号 。 

【 例 8.44】 查找 出 各 个 部 门 负责 人 的 名 字 和 地 址 ， 查 询 语句 如 下 


select head >name, head>address 
from departments 


在 上 面 的 查询 中 ,“head3name” 带 有 人 符号 的 表达 式 被 称 为 路 径 表 达 式 〈Path 
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Expression)。 由 于 head 是 一 个 对 people 表 中 元 组 的 引用 ， 上 述 查 询 中 的 name 属性 就 是 people 
表 中 元 组 的 name 属性 。 引 用 可 以 用 来 隐藏 连接 操作 。 在 上 面 的 例子 中 ， 如 果 没 有 使 用 引用 ， 则 
departments 的 head 字段 就 会 被 声明 为 people 表 的 一 个 外 码 。 要 找 出 一 个 部 门 负责 人 的 姓名 和 地 
址 ， 我 们 就 需要 将 departments 与 people 关系 显 式 地 做 一 个 连接 。 显 然 ， 使 用 引用 可 以 明显 地 简 
化 了 查询 。 


2. 以 集合 体 为 值 的 属性 


怎样 处 理 以 集合 为 值 的 属性 。 一 个 计算 集合 体 值 的 表达 式 可 以 出 现在 关系 名 出 现 的 任何 地 
方 ， 具体 方法 如 例 8.45 所 示 。 

【 例 8.45】 根据 前 面 定 义 的 books 表 ， 查 询 所 有 的 码 中 包含 “database ”字样 的 书 ， 查 询 语 
句 如 下 : 


select title 
from books 
where 'database' in (unnest(keyword-set)) 


unnest(keyword-set) 在 无 嵌 套 关系 的 SQL 中 相当 于 一 个 select-from-where 的 子 表达 式 。 如 果 
我 们 知道 一 本 特定 的 书 具 有 三 个 作者 ， 我 们 会 这 样 写 : 
select author-array[1], author-array[2], author-array[3] 


from books 
where title='Database System Concepts' 


现在 ， 假 定 我 们 想得到 一 个 关系 ， 它 包含 形式 为 “ 书 名 ， 作 者 名 ”， 对 应 每 本 书 和 书 的 每 
个 作者 。 我 们 可 以 使 用 下 面 的 查询 : 


select B.title, A.name 


from books as B, unnest(B.author-array) as A 


于 books 的 author-array 属性 是 一 个 以 集合 体 为 值 的 字段 , 因此 可 以 用 在 需要 有 一 个 关系 
存在 的 fom 子 句 中 。 


3 其 套 与 解除 舱 套 


将 一 个 嵌 套 关系 转换 成 具有 更 少 (或 没有 ) 的 关系 为 值 的 属性 的 形式 的 过 程 被 称 为 解除 嵌 套 
(Unnesting)。books 关系 有 author-array 和 keyword-set 两 个 是 集合 体 的 属性 ， 同 时 books 关系 另 
外 还 有 title 和 publisher 两 个 不 是 集合 体 的 属性 。 
【 例 8.46】 将 books 关系 转化 为 一 个 单一 的 平面 关系 ,使 其 不 包含 嵌 套 关系 或 者 结构 类 型 作 
为 属性 。 我 们 可 以 使 用 以 下 查询 来 完成 这 个 任务 : 
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select title, A as author publishername as pub-name, publisher.branch as pub-branch, 
K as keyword 
from books as B, unnest(B.author-array) as A, unnest (B.keyword-set) as K 


from 子 句 中 的 变量 B 被 声明 为 以 books 为 取 值 范围 ,变量 A 被 声明 为 以 书 B 的 author-array 
中 的 作者 为 取 值 范围 ， 同 时 K 被 声明 为 以 书 B 的 keyword-set 中 的 关键 字 为 取 值 范围 。 图 8-3 
显示 了 books 关系 的 一 个 实例 ， 图 8-4 显示 了 上 述 查 询 的 结果 形成 的 INF 关系 。 
将 一 个 1NF 关系 转化 为 嵌 套 关系 的 反 向 过 程 称 为 嵌 套 (Nesting)。 媒 套 可 以 用 在 SQL 中 的 
分 组 操作 的 一 个 扩展 来 完成 。 在 SQL 中 分 组 的 常规 使 用 中 ， 要 对 每 个 组 (逻辑 上 ) 创建 一 个 临 
时 的 多 重 集合 关系 ， 然 后 在 这 个 临时 关系 上 应 用 一 个 聚集 函数 。 我 们 可 以 通过 返回 这 个 多 重 集 
合 而 不 应 用 聚集 函数 的 方式 创建 一 个 嵌 套 关系 。 
假定 我 们 有 一 个 如 图 8-3 所 示 的 INF 关系 flat-books, 下 面 的 查询 在 属性 keyword 上 对 关系 
进行 了 婴 套 : 
select title, author, Publisher(pub-name, pub-branch) as publisher, 
set(keyword) as keyword-set 
from flat-books 
groupby title, author, publisher 


在 图 8-3 中 flat-books 关系 上 执行 这 个 查询 的 结果 如 图 8-5 所 示 。 


a | publisher(pub-name, pub-branch 


Compilers | Smith | (McGraw-Hill, New York) {parsing, analysis} 
Compilers | Jones | (McGraw-Hill, New York) {parsing, analysis} 
Networks | Jones | (Oxford, London) {Internet, Web} 
Networks | Frick | (Oxford, London) Internet, Web} 


8-5 flat-books 关系 的 一 个 部 分 嵌 套 版 本 
如 果 我 们 要 同时 对 作者 属性 进行 嵌 套 , 而 将 图 8-3 中 1NF 表 flat-books 转化 为 图 8-2 所 示 的 
巍 套 表 books， 我 们 可 以 使 用 如 下 查询 : 


select title, set(author) as author-set, Publisher(pub-name, pub-branch) as publisher, 
set(keyword) as keyword-set 
from flat-books 
groupby title, publisher 
另 一 种 创建 嵌 套 关系 的 方法 是 在 select 语句 中 使 用 子 查询 。 下 面 的 查询 阐明 了 该 方法 ， 它 
与 上 面 的 查询 执行 了 同样 的 任务 。 
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Select title, 
(select author 
from flat-books as M 
where Mtitle=O.title) as author-set, 
Publisher(pub-name, pub-branch) as publisher, 
(Select keyword 
from flat-books as N 
where N.title=O.title) as keyword-set, 
from flat-books as O 


系统 对 select 子 句 中 对 外 部 查询 中 的 fom 和 where 子 句 生成 的 每 一 个 元 组 执行 嵌 套 子 查询 。 


观察 到 和 


部 查询 中 的 O.title 属性 被 用 到 嵌 套 查询 中 ,以 确保 对 每 一 本 书 的 题目 产生 正确 的 作者 和 


关键 字 集 合 。 这 种 方法 的 优点 在 于 可 以 在 嵌 套 查询 上 使 用 orderby 子 句 生成 一 个 有 序 的 结果 。 数 


组 或 是 丙 
8.8.6 


l 表 可 以 从 代 套 查询 的 结果 中 构造 出 来 。 如 果 没 有 排序 ， 数 组 和 列表 将 不 能 唯一 确定 。 
函数 和 过 程 


SQL-99 允许 定义 函数 、 过 程 和 方法 。 定 义 可 以 通过 SQL-99 的 有 关 过 程 的 组 件 ， 也 可 以 通 
过 外 部 的 程序 设计 语言 ， 例 如 Java、C 或 CH+。 我 们 首先 看 一 个 SQL-99 中 的 定义 ， 然 后 了 解 


如 何 使 


外 部 语言 中 的 定义 。 有 些 数据 库 系 统 支 持 它们 自己 的 过 程 语言 ， 例 如 Oracle 中 的 


PL/SQL 
在 语法 条 
1. 


和 Microsoft SQLServer 中 的 TransactSQL。 它 们 类 似 于 SQL-99 的 有 关 过 程 的 部 分 ， 但 
[语义 上 有 所 区 别 ， 详 细 信 息 可 参见 各 自 的 系统 手册 。 


SQL 函数 和 过 程 


假定 我 们 想 要 这 样 一 个 函数 : 给 定 一 个 书 名 , 返回 其 作者 数 , 使 用 4NF 模式 (参见 图 8-4)。 
我 们 可 以 用 下 面 这 种 方式 定义 这 个 函数 : 


create function author-count(title varchar(20)) 


returns integer 
begin 
declare a-count integer; 
select count(author) into a-count 
from authors 
where authors.title=title 
return a-count; 
end 


这 个 过 程 可 以 用 在 一 个 返回 具有 多 于 一 个 作者 的 所 有 书 的 名 称 的 查询 : 
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select title 
from books4 
where author-count(title)>1 


函数 对 于 特定 的 数据 类 型 〈 比 如 图 像 和 几何 对 象 ) 来 说 特别 有 用 。 例如， 用 在 地 图 数据 库 中 
的 一 个 多 边 形 数据 类 型 可 能 有 一 个 相关 函数 用 于 判断 两 个 多 边 形 是 否 重合 , 一 个 图 像 数据 类 型 可 
能 有 一 个 相关 函数 用 于 比较 两 幅 图 的 相似 性 。 函 数 可 以 用 外 部 语言 (比如 C) 来 编写 。 一 些 数据 
库 系统 也 支持 返回 关系 〈 即 元 组 的 多 重 集合 ) 的 函数 ， 尽 管 SQL-99 并 不 支持 这 些 函 数 。 

前 面 介绍 的 方法 ， 可 以 看 作 与 结构 类 型 相关 联 的 函数 。 它 们 的 第 一 个 参数 self 是 隐 含 的 ， 
它 被 设置 为 调用 这 个 方法 的 结构 类 型 的 值 。 因 此 ， 方 法 主体 可 以 通过 selfa 来 引用 这 个 值 的 属 
性 a。 这 些 属 性 也 可 以 被 该 方法 更 新 。 

SQL-99 也 支持 过 程 。author-count 函数 也 可 以 写成 一 个 过 程 : 


Create procedure author-count-proc(in title varchar(20), out a-count integer) 
begin 
select count(author) into a-count 
from authors 
where authors.title=title 
end 


可 以 从 一 个 SQL 过 程 中 或 者 从 嵌入 式 SQL 中 使 用 call 语句 调用 过 程 : 


declare a-count integer; 


call author-count-proc(Database Systems Concepts', a-count); 

SQL-99 允许 多 个 过 程 同 名 ， 只 要 同名 的 不 同 过 程 的 参数 个 数 不 同 。 名 称 和 参数 个 数 用 于 
标识 一 个 过 程 。SQL-99 也 允许 多 个 函数 同名 ， 只 要 这 些 同 名 的 不 同 函数 的 参数 个 数 不 同 ， 或 
者 ， 对 于 那些 有 相同 个 数 参 数 的 函数 ， 至 少 有 一 个 参数 的 类 型 不 同 。 

2. 外 部 语言 程序 


SQL-99 允许 使 用 一 种 程序 设计 语言 (如 C 或 Ct+) 定义 函数 。 这 种 方式 定义 的 函数 会 比 
SQL 中 定义 的 函数 效率 更 高 ， 无 法 在 SQL 中 执行 的 计算 可 以 由 这 些 函数 执行 。 
【 例 8.47】 在 一 个 元 组 的 数据 上 执行 复杂 数学 计算 。 外 部 过 程 和 函数 可 以 这 样 指定 : 
create procedure author-count-proc(in title varchar(20), out count integer) 
language C 


external name Wusr/avi/bin/author-count-proc' 
create function author-count (title varchar(20)) 
returns integer 
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language C 
external name /usr/avi/bin/author-count 


外 部 语言 过 程 需要 处 理 空 值 和 异常 。 因 此 它们 必须 具有 几 个 额外 的 参数 : 一 个 指明 失败 / 


成 功 状态 的 sqlstate 值 ， 一 个 存储 函数 返回 值 的 参数 ， 和 一 些 指明 每 个 参数 /函数 结果 的 值 是 否 
为 空 的 指示 器 变量 。 在 声明 语句 的 上 方 添加 额外 的 一 行 parameter style general 指明 外 部 过 程 / 


函数 只 使 用 说 明 的 变量 并 且 不 处 理 空 值 和 异常 。 


3. 过 程 的 构造 
SQL-99 支持 多 种 过 程 的 构造 ， 这 赋予 它 与 通用 程序 设计 语言 相当 的 几乎 所 有 的 功能 。 


SQL-99 标准 中 处 理 这 些 构造 的 部 分 称 为 持久 存储 模块 (Persistent Stroage Module, PSM)。 


1) while 语句 和 repeat 语句 
一 个 复合 语句 有 begin … end 的 形式 ， 在 begin 和 end 之 间 会 包含 多 条 SQL 语句 。SQL-99 


支持 while 语句 和 repeat 语句 ， 语 法 如 下 : 


for 


declare n integer default 0; 
while n<10 do 
set n=n+1; 
end while 
repeat 
set n=n-1; 
until n=0 
end repeat 
这 段 代码 没什么 用 ， 只 是 说 明 while 和 repeat 循环 的 语法 。 
2) for 语句 
for 循环 ， 多 许 对 查询 的 所 有 结果 进 代 


declare n integer default 0; 
forr as 
select balance from account 
where branch-name=' Perryridge' 
do 
setn=n+rbalance 
end for 


程序 在 for 循环 开始 执行 的 时 候 隐 式 地 打开 一 个 游标 ， 并 且 用 它 每 次 获得 一 个 行 的 值 存 入 
循环 变量 〈 在 上 面 例子 中 指 r) 中 。 赋 予 该 游标 一 个 名 称 是 有 可 能 的 ， 可 通过 在 关键 字 as 


后 插入 文本 cn cursor for 即 可 完成 ， 其 中 的 cn 是 游标 的 名 称 。 游 标 名 可 用 于 对 该 游标 指向 的 元 
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组 进行 更 新 /删除 操作 。 语 句 leave 可 用 来 退出 循环 ， 而 iterate 表示 跳 过 剩余 语句 从 循环 的 开始 
进入 下 一 个 元 组 。 

3) 让 then-else 语句 与 case 语句 

条 件 语句 包括 论 then-else 语句 ， 使 用 语法 如 下 : 


ifr.balance<1000 


then.set l=]+r.balance 


elseif r.balance<5000 


then set m=m+tr.balance 


else set h=h+rbalance 


endi 


f 


这 段 代 码 假定 1 m 和 n 是 整 型 变量 , r 是 行 变量 。 如果 我 们 用 这 段 fthen-else 代码 替换 掉 
前 面 一 段 的 for 循环 中 的 “set n=n+tr.balance” 行 ， 则 循环 将 分 别 按照 低 、 中 和 高 余额 分 别 计算 
这 三 类 账户 余额 的 总 数 。 


SQL-99 
SQL-99 
来 处 理 异 常 ， 


的 case 语句 类 似 于 C/C++ 语言 中 的 case 语句 。 
还 包括 发 信号 通知 异常 条 件 (Exception Condition ) 的 概念 , 以 及 声明 句柄 (Handler) 
代码 如 下 : 


declare out-of-stock condition 


declare exit handler for out-of-stock 


begin 


end 


在 begin 
如 果 条 件 发 9 


g 和 end 之 间 的 语句 可 以 执行 signal out-of-stock 来 引发 一 个 异常 。 这 个 句柄 说 明 ， 
E， 将 会 采取 动作 终止 begin end 中 的 语句 。 替 换 的 动作 将 是 continue， 它 继续 从 引 


发 异常 的 语句 的 下 一 条 语句 开始 执行 。 除 了 明确 定义 的 条 件 ， 还 有 一 些 预 定义 的 条 件 ， 比 如 


sqlexception、 


sqlwarning 和 not found。 


图 8-6 是 有 关 SQL-99 的 过 程 构造 的 实例 。 过 程 fndEmpl 计算 给 定 经 理 (由 参数 mgr 指定 ) 
的 所 有 直接 和 非 直接 管理 的 员工 的 集合 ， 并 且 将 结果 集中 员工 名 字 存 储 在 一 个 被 称 为 empl 的 
关系 中 (假定 这 个 关系 已 经 存在 )。 关 系 manager (empname，mgrname) (假定 可 用 ) 指明 了 谁 
直接 为 哪个 经 理工 作 。 所 有 的 直接 / 非 直接 管理 的 员工 的 集合 构成 了 manager 关系 的 传递 闭 包 的 


主体 。 


该 过 程 使 用 了 两 个 临时 表 : newemp 和 temp。 该 过 程 在 repeat 循环 之 前 把 所 有 直接 为 mgr 工 
作 的 员工 插入 到 newemp 中 。Repeat 循环 首先 把 newemp 中 的 所 有 员工 添加 到 empl 中 。 然 后 ， 
它 计算 为 newemp 中 为 经 理工 作 (除了 那些 已 经 找到 的 mgr 的 员工 ) 并 把 它们 存储 到 临时 表 temp 


Ee 
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终止 


查找 从 给 定 城 


中 。 最 后 用 temp 上 


的 内 容 蔡 换 newemp 中 的 内 容 。Repeat 循环 在 找 不 到 新 员工 〈 非 直接 的 ) 时 
我 们 注意 到 except 子 句 的 用 处 ， 它 确保 即使 在 有 管理 的 循环 〈 反 常 的 ) 情况 下 ， 该 过 程 仍 
可 工作 。 例 如 ， 如 果 a 为 b 工作 ，b 为 工作， 而 c 又 为 a 工 作 ， 就 出 现 了 循环 。 


create procedure findEmpl(in mgr char(10)) 


-- 关 系 manager(empname, mgrname) 指 出 谁 直接 为 谁 工作 。 
begin 
create temporary table newemp (name char(10)); 
create temporary table temp (name char(10)); 
insert into newemp 
select empname 
from manager 
where mgrname=mgr 
repeat 
insert into empl 
select name 
from newemp; 


insert into temp 
(select manager.empname 
from newemp, manager 


) 

except ( 
select empname 
from empl 

); 


delete from newemp; 
insert into newemp 
Select * 
from temp; 
delete from temp; 


until not exists (select*from newemp) 
end repeat; 
End 


图 8-6 ” 找 出 一 个 经 理 管理 的 所 有 员 了 
虽然 在 管理 控制 中 循环 不 可 能 出 现 ， 但 是 其 他 的 应 用 中 可 能 会 出 现 循环 。 例 如 ， 假 设 我 们 
有 关系 flights(to, from), 表示 从 一 个 城市 直 飞 可 达 的 其 他 城市 。 我们 可 以 修改 findEmple 过 程 来 
利用 一 次 或 多 次 航班 的 一 个 序列 能 到 达 的 所 有 城市 。 所 有 我 们 要 做 的 就 是 用 


flight 替换 manager 并 且 替 换 相应 的 属性 名 。 这 种 情况 下 有 可 能 


于 该 过 程 排 除了 已 经 找到 的 城市 ， 所 以 它 能 正确 执行 。 


-- 找 出 所 有 直接 或 间接 为 mgr 工作 的 员工 ， 并 将 他 们 加 到 关系 empl(name) 中 。 


where newemp.empname=manager.mgrname; 


现 一 个 可 到 达 性 的 循环 , 但 是 
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本 章 的 主要 内 容 包 括 软件 工程 基础 知识 、 系 统 分 析 与 设计 基础 知识 ， 系 统 实施 基础 知识 以 
及 系统 运行 与 维护 基础 知识 等 。 


9.1 软件 工程 基础 知识 


1968 年 ， 在 德国 召开 的 NATO (North Atlantic Treaty Organization， 北 大 西洋 公约 组 织 ) 会 
议 上 ， 首 次 提出 了 “软件 工程 ”这 个 名 词 ， 希 望 用 工程 化 的 原则 和 方法 来 克服 软件 危机 。 在 此 
以 后 ， 人 们 开展 了 软件 开发 模型 、 开 发 方法 、 工 具 与 环境 的 研究 ， 提 出 了 瀑布 模型 、 演 化 模型 、 
螺旋 模型 和 喷泉 模型 等 开发 模型 ， 出 现 了 面向 数据 流 方法 、 面 向 数据 结构 的 方法 、 面 向 对 象 方 
法 等 开发 方法 , 以 及 一 批 CASE (Computer Aided Software Engineering, 计算 机 辅助 的 软件 工程 ) 
工具 和 环境 。 现 在 软件 工程 已 经 成 为 计算 机 软件 的 一 个 重要 分 支 和 研究 方向 。 

软件 工程 是 指 应 用 计算 机 科学 、 数 学 及 管理 科学 等 原理 (如 图 9-1 所 示 )， 以 工程 化 的 原 
则 和 方法 来 解决 软件 问题 的 工程 ， 其 目的 是 提高 软件 生产 率 、 提 高 软件 质量 、 降 低 软 件 成 本 。 
软件 工程 涉及 到 软件 开发 、 维 护 、 管 理 等 多 方面 的 原理 、 方 法 、 工 具 与 环境 ， 限 于 篇 幅 ， 本 章 
不 能 对 软件 工程 做 全 面 的 介绍 。 根 据 数据 库 系统 工程 师 级 考试 大 纲 的 要 求 ， 本 章 着 重 介绍 软件 
开发 过 程 中 的 原理 ， 其 他 内 容 只 作 简 单 的 介绍 。 


软件 开发 方法 学 
软件 开发 技术 区 


软件 工程 环境 


软件 工程 学 
软件 工程 管理 学 
软件 工程 管理 
软件 经 济 学 


图 9-1 软件 工程 学 的 范畴 


9.1.1 软件 工程 基本 原理 
美国 著名 的 软件 工程 专家 B.W.Boehm 于 1983 年 提出 了 软件 工程 的 7 条 基本 原理 。Boehm 
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认为 这 7 条 原理 是 确保 软件 产品 质量 和 开发 效率 的 原理 的 最 小 集合 。 
1. 用 分 阶段 的 生命 周期 计划 严格 管理 


统计 表明 ，50% 以 上 的 失败 项 目 是 由 于 计划 不 周 造成 的 。 在 软件 开发 与 维护 的 漫长 生命 周 
期 中 ， 需 要 完成 许多 行 之 各 异 的 工作 。 这 条 基本 原理 意味 着 ， 应 该 把 软件 生命 周期 划分 成 若干 
个 阶段 ， 并 相应 地 制定 出 切实 可 行 的 计划 ， 然 后 严格 按照 计划 对 软件 的 开发 与 维护 工作 进行 管 
理 。Boehm 认为 ， 在 软件 的 整个 生存 周期 中 应 该 制定 并 严格 执行 六 类 计划 : 项 目 概要 计划 、 里 
程 碑 计划 、 项 目 控制 计划 、 产 品 控制 计划 、 验 证 计划 和 运行 维护 计划 。 


2. 坚持 进行 阶段 评审 


统计 结果 显示 ， 大 部 分 错误 是 在 编码 之 前 造成 的 。 根 据 Boehm 等 人 的 统计 ， 设 计 错 误 占 
软件 错误 的 63%， 编 码 错误 仅 占 37%。 而 且 错 误 发 现 与 改正 得 越 晚 ， 所 需 付 出 的 代价 就 越 高 。 
因此 ， 在 每 个 阶段 都 应 进行 严格 的 评审 ， 以 便 尽早 发 现在 软件 开发 过 程 所 犯 的 错误 。 


3. 实现 严格 的 产品 控制 


在 软件 开发 过 程 中 不 应 随意 改变 需求 ， 因 为 改变 一 项 需求 需要 付出 较 高 的 代价 。 但 是 ,在 
软件 开发 过 程 中 改变 需求 又 是 难免 的 ， 由 于 外 部 环境 的 变化 ， 相 应 地 改变 用 户 需 求 是 一 种 客观 
需要 ， 这 就 要 采用 科学 的 产品 控制 技术 来 顺应 这 种 要 求 。 当 改变 需求 时 ， 为 了 保持 软件 各 个 配 
置 成 分 的 一 致 性 ， 必 须 实行 严格 的 产品 控制 ， 其 中 主要 是 实行 基准 配置 管理 。 所 谓 基 准 配置 又 
称 为 基线 配置 ， 它 们 是 经 过 阶段 评审 后 的 软件 配置 成 分 (各 个 阶段 产生 的 文档 或 程序 代码 )。 
基准 配置 管理 也 称 为 变动 控制 :一 切 有 关 修 改 软件 的 建议 ， 特 别 是 设计 到 对 基准 配置 的 修改 建 
议 ， 都 必须 按照 严格 的 规程 进行 评审 ， 获 得 批准 以 后 才能 实施 修改 。 


4. 采用 现代 程序 设计 技术 
从 20 世纪 60 年 代 和 70 年 代 的 结构 化 软件 开发 技术 ， 到 面向 对 象 技术 ， 从 第 一 、 第 二 代 


语言 到 第 四 代 语 言 ， 人 们 已 经 充分 认识 到 : 方法 大 于 力气 。 采 用 先进 的 技术 既 可 以 提高 软件 开 
发 的 效率 ， 又 可 以 降低 软件 维护 的 成 本 。 


5. 结果 应 能 清楚 地 审查 


软件 是 一 种 看 不 见 、 摸 不 着 的 逻辑 产品 。 软 件 开发 小 组 的 工作 进展 情况 可 见 性 差 ， 难 于 评 
价 和 管理 。 为 了 更 好 地 进行 管理 ， 应 根据 软件 开发 的 总 目标 及 完成 期 限 ， 尽 量 明 确 地 规定 开发 
小 组 的 责任 和 产品 标准 ， 从 而 使 得 所 得 到 的 结果 能 够 清楚 地 审查 。 
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6. 开发 小 组 的 人 员 应 少 而 精 


发 人 员 的 素质 和 数量 是 影响 软件 质量 和 开发 效率 的 重要 因素 ， 应 该 少 而 精 。 这 一 条 基于 
两 点 原因 : 高 素质 开发 人 员 的 效率 比 低 素 质 开 发 人 员 的 效率 要 高 几 倍 到 几 十 倍 ， 开 发 工作 中 犯 
的 错误 也 要 少 得 多 ; 当 开 发 小 组 为 N 人 时 ， 可 能 的 通信 信道 为 N(N-1)/2。 可 见 随 着 人 数 N 的 增 
大 ， 通 信 开 销 将 急剧 增 大 。 


7. 承认 不 断 改 进 软件 工程 实践 的 必要 性 


遵循 上 述 六 条 基本 原理 ， 就 能 够 按照 当代 软件 工程 基本 原理 实现 软件 的 工程 化 生产 。 但 是 
它们 只 是 对 现 有 经 验 的 总 结 和 归纳 ， 并 不 能 保证 软件 开发 与 维护 的 过 程 能 赶 上 时 代 前 进 的 步 
伐 ， 能 跟 上 技术 的 不 断 进 步 。 因 此 ，Boehm 提出 应 把 “承认 不 断 改进 软件 工程 实践 的 必要 性 ” 
作为 软件 工程 的 第 7 条 原理 。 根 据 这 条 原理 ， 用 户 不 仅 要 积极 采纳 新 的 软件 开发 技术 ， 还 要 注 
意 不 断 总 结 经 验 ， 收 集 进 度 和 消耗 等 数据 ， 进 行 出 错 类 型 和 问题 报告 统计 。 这 些 数据 既 可 以 用 
来 评估 新 的 软件 技术 的 效果 ， 也 可 以 用 来 指明 必须 着 重 注意 的 问题 和 应 该 优先 进行 研究 的 工具 
和 技术 。 


9.1.2 ”软件 生存 周期 模型 


1. 软件 生存 周期 


同 任何 事物 一 样 ， 一 个 软件 产品 或 软件 系统 也 要 经 历 孕 育 、 诞 生 、 成 长 、 成 熟 、 衰 亡 的 许 
多 阶段 ， 一 般 称 为 软件 生存 周期 。 把 整个 软件 生存 周期 划分 为 若干 阶段 ， 每 个 阶段 的 任务 相对 
独立 ， 而 且 比 较 简 单 ， 便 于 不 同人 员 分 工 协作 ， 从 而 降低 了 整个 软件 开发 工程 的 困难 程度 。 通 
常 ， 软 件 生 存 周 期 包括 可 行 性 分 析 与 项 目 开发 计划 、 需 求 分 析 、 总 体 设计 、 详 细 设 计 、 编 码 和 
单元 测试 、 综 合 测试 及 维护 阶段 。 

1) 可 行 性 分 析 与 项 目 开发 计划 

可 行 性 分 析 与 项 目 开发 计划 阶段 的 主要 任务 是 确定 软件 的 开发 目标 及 可 行 性 。 必 须 考 虑 的 
关键 问题 是 :“ 要 解决 的 问题 是 什么 ?” ”,“ 对 这 些 问题 有 可 行 的 解决 办 法 吗 ? ”等 。 可 行 性 分 
析 的 任务 不 是 具体 解决 问题 ， 而 是 研究 问题 的 范围 ， 探 索 这 个 问题 是 否 值得 去 解 ， 是 否 有 可 行 
的 解决 办 法 。 该 阶段 应 该 给 出 关于 问题 定义 、 可 行 性 分 析 和 项 目 开发 计划 。 

该 阶段 的 参与 人 员 应 该 有 项 目 负责 人 、 用 户 和 系统 分 析 师 。 

2) 需求 分 析 

需求 分 析 阶 段 的 任务 不 是 具体 地 解决 问题 ， 而 是 准确 地 确定 软件 系统 必须 做 什么 ， 确 定 软 
件 系统 的 功能 、 性 能 、 数 据 和 界面 等 要 求 ， 从 而 确定 系统 的 逻辑 模型 。 
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3) 概要 设计 

在 概要 设计 阶段 ， 开 发 人 员 需 要 将 确定 的 功能 需求 转换 成 相应 的 体系 结构 。 在 该 体系 结构 
中 ， 每 个 成 分 都 是 意义 明确 的 模块 ， 即 每 个 模块 都 和 某 些 功能 需求 相对 应 。 可 见 ， 概 要 设计 就 
是 设计 软件 的 结构 ， 明 确 软件 有 哪些 模块 组 成 ， 模 块 的 层次 以 及 功能 。 与 此 同时 ， 还 要 应 用 系 
统 的 总 体 数据 结构 和 数据 库 结构 。 概 要 设计 阶段 的 主要 参与 人 员 有 系统 分 析 师 和 软件 设计 师 。 

4) 详细 设计 

详细 设计 阶段 的 主要 任务 就 是 对 每 个 模块 完成 的 功能 进行 具体 描述 ， 不 是 编写 程序 ， 而 是 
设计 出 程序 的 详细 规格 说 明 ， 该 说 明 应 该 包含 必要 的 细节 ， 使 程序 员 可 以 根据 它们 写 出 实际 的 
程序 代码 。 通 常 采用 HIPO〈 层 次 加 输入 /处 理 / 输 出 图 ) 或 PDL 语言 (过 程 设 计 语言 ) 描 述 详 
细 设 计 的 结果 。 该 阶段 的 主要 参与 人 员 有 软件 设计 师 和 程序 员 。 

5) 编码 和 单元 测试 

编码 和 单元 测试 阶段 就 是 把 每 个 模块 的 控制 结构 转换 成 计算 机 可 接受 的 程序 代码 ， 即 写成 
某 种 特定 程序 设计 语言 表示 的 源 程序 清单 ， 并 仔细 测试 编写 出 的 每 一 个 模块 。 

6) 综合 测试 

综合 测试 阶段 的 关键 任务 是 通过 各 种 类 型 的 测试 (及 相应 的 测试 ) 使 软件 达到 预定 的 要 求 。 
最 基本 的 测试 是 集成 测试 和 验收 测试 。 所 谓 集成 测试 是 根据 设计 的 软件 结构 ， 把 经 过 单元 测试 
检验 的 模块 按 某 种 选 定 的 策略 装配 起 来 ， 在 装配 过 程 中 对 程序 进行 必要 的 测试 。 所 谓 验 收 测试 
是 按照 规格 说 明 书 的 规定 〈 通 常 在 需求 分 析 阶 段 确定 )， 由 用 户 〈 或 在 用 户 积极 参与 下 ) 对 目 
标 系统 进行 验收 。 通 过 对 软件 测试 结果 的 分 析 可 以 预测 软件 的 可 靠 性 ， 反 之 ， 根 据 对 软件 可 靠 
性 的 要 求 , 也 可 以 决定 测试 和 调试 过 程 什么 时 候 可 以 结束 。 应 该 用 正式 的 文档 资料 把 测试 计划 、 
详细 测试 方案 以 及 实际 测试 结果 保存 下 来 ， 作 为 软件 配置 的 一 个 组 成 部 分 。 

7) 维护 

维护 阶段 是 软件 生存 期 中 时 间 最 长 的 阶段 。 软 件 一 旦 交付 正式 投入 运行 后 便 进 入 软件 维护 
阶段 。 该 阶段 的 关键 任务 是 通过 各 种 必要 的 维护 活动 使 系统 持久 地 满足 用 户 的 需要 。 通 常 有 改 
正 性 、 适 应 性 、 完 善 性 和 预防 性 四 类 维护 活动 。 其 中 ， 改 正 性 维护 是 指 诊断 和 改正 在 使 用 过 程 
中 发 现 的 软件 错误 ， 适应 性 维护 是 指 修改 软件 以 适应 环境 的 变化 ， 完 善 性 维护 是 指 根据 用 户 的 
要 求 改进 或 扩充 软件 使 它 更 完善 ， 预 防 性 维护 是 指 修改 软件 为 将 来 的 维护 活动 预先 做 准备 。 
注意 : 每 一 项 维护 活动 都 应 该 准确 地 记录 下 来 ， 作 为 正式 的 文档 资料 加 以 保存 。 


2. 软件 生存 周期 模型 


软件 生存 周期 模型 是 一 个 包括 软件 产品 开发 、 运行 和 维护 中 有 关 过 程 、 活 动 和 任务 的 框架 ， 
覆盖 了 从 该 系统 的 需求 定义 到 系统 的 使 用 终止 (IEEE 标准 12207.0 一 1996)。 把 这 个 概念 应 用 到 
开发 过 程 ， 可 以 发 现 所 有 生存 周期 模型 的 内 在 基本 特征 : 描述 了 开发 的 主要 阶段 ， 定义 了 每 一 
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个 阶段 要 完成 的 主要 过 程 和 活动 ， 规范 了 每 一 个 阶段 的 输入 和 输出 (提交 物 )， 提 供 了 一 个 框 
架 ， 可 以 把 必要 的 活动 映射 到 该 框架 中 。 

常见 的 软件 生存 周期 模型 有 瀑布 模型 、 演 化 模型 、 螺 旋 模 型 和 喷泉 模型 等 。 

1) 瀑布 模型 (Waterfall Model) 

瀑布 模型 是 将 软件 生存 周期 各 个 活动 规定 为 依 线性 顺序 连接 的 若干 阶段 的 模型 。 它 包括 可 
需求 分 析 、 设 计 、 编 码 、 测 试 、 运 行 和 维护 。 它 规定 了 由 前 至 后 、 相 互 衔接 的 固定 次 序 ， 如 同 
瀑布 流水 ， 逐 级 下 落 ， 如 图 9-2 所 示 。 

瀑布 模型 为 软件 的 开发 和 维护 提供 了 一 种 有 效 
的 管理 模式 , 根据 这 一 模式 制定 开发 计划 , 进行 成 本 
预算 , 组 织 开 发 力量 , 以 项 目的 阶段 评审 和 文档 控制 
为 手段 有 效 地 对 整个 开发 过 程 进行 指导 , 所 以 它 是 以 
文档 作为 驱动 、 适 合 于 软件 需求 很 明确 的 软件 项 目的 
模型 。 

瀑布 模型 假设 ， 一 个 待 开发 的 系统 需求 是 完整 
的 、 简 明 的 、 一 致 的 ， 而 且 可 以 先 于 设计 和 实现 完成 运行 与 维护 
之 前 产生 。 瀑 布 模型 的 优点 是 ， 容 易 理 解 ， 管 理 成 本 图 9.2 瀑布 模型 
低 ; 强调 开发 的 阶段 性 早期 计划 及 需求 调查 和 产品 测 
试 。 不 足 之 处 是 ， 客 户 必须 能 够 完整 、 正 确 和 清晰 地 表达 他 们 的 需要 ， 在 开始 的 两 个 或 三 个 阶 
段 中 ， 很 难 评估 真正 的 进度 状态 ， 当 接近 项 目 结束 时 ， 出 现 了 大 量 的 集成 和 测试 工作 ， 直 到 项 
目 结束 之 前 ， 都 不 能 演示 系统 的 能 力 。 在 瀑布 模型 中 ， 需 求 或 设计 中 的 错误 往往 只 有 到 了 项 目 
后 期 才能 够 被 发 现 ， 对 于 项 目 风 险 的 控制 能 力 较 弱 ， 从 而 导致 项 目 常 常 延期 完成 ， 开 发 费用 超 
出 预算 。 

2) 增 量 模 型 (Incremental Model) 

增 量 模型 融合 了 瀑布 模型 的 基本 成 分 和 原型 实现 的 迭代 特征 ， 它 假设 可 以 将 需求 分 段 为 一 

系列 增 量 产品 , 每 一 增 量 可 以 分 别 地 开发 。 该 模型 采用 随 着 日 程 时 间 的 进展 而 交错 的 线性 序列 ， 
每 一 个 线性 序列 产生 软件 的 一 个 可 发 布 的 “ 增 量 ”如 图 9-3 所 示 。 当 使 用 增 量 模型 时 ， 第 1 个 
增 量 往往 是 核心 的 产品 。 客 户 对 每 个 增 量 的 使 用 和 评估 都 作为 下 一 个 增 量 发 布 的 新 特征 和 功 
能 ， 这 个 过 程 在 每 一 个 增 量 发 布 后 不 断 重复 ， 直 到 产生 了 最 终 的 完善 产品 。 增 量 模 型 强调 每 一 
个 增 量 均 发 布 一 个 可 操作 的 产品 。 
增 量 模型 作为 瀑布 模型 的 一 个 变 体 ， 具 有 瀑布 模型 的 所 有 优点 ， 此 外 ， 它 还 有 以 下 优点 : 
第 一 个 可 交付 版 本 所 需要 的 成 本 和 时 间 很 少 ， 开 发 由 增 量 表示 的 小 系统 所 承担 的 风险 不 大 ; 
于 很 快 发 布 了 第 一 个 版 本 ， 因 此 可 以 减少 用 户 需 求 的 变更 ;运行 增 量 投资 ， 即 在 项 目 开 始 时 ， 
可 以 仅 对 一 个 或 两 个 增 量 投资 。 
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增 量 1 
增 量 1 | 分 析 设计 编码 测试 交付 客户 


增 量 2 

2 | 2 | Ee 
增 量 3 
sit | 2 | Ee 


增 量 n 
分 析 H+ 设计 | 编码 | 测试 交付 客户 


图 9-3 增 量 模 型 


增 量 模型 的 不 足 之 处 : 如果 没有 对 用 户 的 变更 要 求 进行 规划 ， 那 么 产生 的 初始 增 量 可 能 会 
造成 后 来 增 量 的 不 稳定 ， 如 果 需 求 不 像 早期 思考 的 那样 稳定 和 完整 ， 那 么 一 些 增 量 就 可 能 需要 
重新 开发 ， 重 新 发 布 ， 管 理发 生 的 成 本 、 进 度 和 配置 的 复杂 性 ， 可 能 会 超出 组 织 的 能 力 。 

3) 演化 模型 (Evolutionary Model) 

演化 模型 主要 针对 事先 不 能 完整 定义 需求 的 软件 开发 ， 是 在 快速 开发 一 个 原型 的 基础 上 ， 
根据 用 户 在 使 用 原型 的 过 程 中 提出 的 意见 和 建议 对 原型 进行 改进 ， 获 得 原型 的 新 版 本 。 重 复 这 
一 过 程 ， 最 终 可 得 到 令 用 户 满意 的 软件 产品 。 

演化 模型 的 主要 优点 是 ， 任 何 功能 一 经 开发 就 能 进入 测试 ， 以 便 验 证 是 否 符合 产品 需求 ， 
可 以 帮助 引导 出 高 质量 的 产品 要 求 。 其 主要 缺点 是 ， 如 果 不 加 控制 地 让 用 户 接触 开发 中 尚未 稳 
定 的 功能 ， 可 能 对 开发 人 员 及 用 户 都 会 产生 负面 影响 。 

4) 螺旋 模型 《Spiral Model) 

对 于 复杂 的 大 型 软件 ， 开 发 一 个 原型 往往 达 不 到 要 求 。 螺 旋 模 型 将 瀑布 模型 和 演化 模型 结 
合 起 来 ， 加 入 了 两 种 模型 均 忽 略 的 风险 分 析 ， 弥 补 了 这 两 种 模型 的 不 足 。 

螺旋 模型 将 开发 过 程 分 为 几 个 螺旋 周期 ， 每 个 螺旋 周期 大 致 和 瀑布 模型 相符 合 ， 如 图 9-4 
所 示 。 在 每 个 螺旋 周期 分 为 如 下 4 个 工作 步骤 。 

(1) 制定 计划 。 确 定 软件 的 目标 ， 选 定 实施 方案 ， 明 确 项 目 开发 的 限制 条 件 。 

(2) 风险 分 析 。 分 析 所 选 的 方案 ， 识 别 风险 ， 消 除 风 险 。 

(3) 实施 工程 。 实 施 软件 开发 ， 验 证 阶段 性 产品 。 

(4) 用 户 评 估 。 评 价 开发 工作 ， 提 出 修正 建议 ， 建 立 下 一 个 周期 的 开发 计划 。 

螺旋 模型 强调 风险 分 析 ， 使 得 开发 人 员 和 用 户 对 每 个 演化 层 出 现 的 风险 有 所 了 解 ， 继 而 做 
出 应 有 的 反应 。 因 此 特别 适用 于 庞大 、 复 杂 并 且 具 有 高 风险 的 系统 。 

与 瀑布 模型 相 比 ， 螺 旋 模型 支持 用 户 需求 的 动态 变化 ， 为 用 户 参 与 软件 开发 的 所 有 关键 决 
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策 提 供 了 方便 ， 有 助 于 提高 软件 的 适应 能 力 ， 并 且 为 项 目 管理 人 员 及 时 调整 管理 决策 提供 了 便 
利 ， 从 而 降低 了 软件 开发 的 风险 。 在 使 用 螺旋 模型 进行 软件 开发 时 ， 需 要 开发 人 员 具 有 相当 丰 
富 的 风险 评估 经 验 和 专门 知识 。 另 外 ， 过 多 的 迭代 次 数 会 增加 开发 成 本 ， 延 迟 提交 时 间 。 


制定 计划 
决定 目标 、 
方案 和 限制 


图 9-4 ”螺旋 模型 


5) 喷泉 模型 (Water Fountain Model) 

喷泉 模型 是 一 种 以 用 户 需求 为 动力 , 以 对 象 作为 驱动 的 模型 , 适合 于 面向 对 象 的 开发 方法 。 
它 克服 了 瀑布 模型 不 支持 软件 重用 和 多 项 开发 活动 集成 的 局 限 性 。 
喷泉 模型 使 开发 过 程 具有 迭代 性 和 无 间隙 性 。 和 迭代 意味 着 模型 中 的 
开发 活动 常常 需要 重复 多 次 ， 在 迭代 过 程 中 不 断 地 完善 软件 系统 。 
无 间隙 是 指 在 开发 活动 〈 如 分 析 、 设 计 、 编 码 ) 之 间 不 存在 明显 的 
边界 ， 也 就 是 说 ， 它 不 像 瀑布 模型 那样 ， 需 求 分 析 活 动 结束 后 才 开 
始 设计 活动 ， 设 计 活动 结束 后 才 开 始 编码 活动 ， 而 是 允许 各 开发 活 
动 交叉 、 迭 代 地 进行 。 

喷泉 模型 如 图 9-5 所 示 ， 该 模型 的 各 个 阶段 没有 明显 的 界限 ， 
开发 人 员 可 以 同步 进行 。 其 优点 是 可 以 提高 软件 项 目 开发 效率 ， 节 
省 开发 时 间 。 由 于 喷泉 模型 在 各 个 开发 阶段 是 重 且 的， 在 开发 过 程 
过 程 中 需要 大 量 的 开发 人 员 ， 不 利于 项 目的 管理 。 此 外 这 种 模型 要 
求 严格 管理 文档 ， 使 得 审核 的 难度 加 大 。 


图 9-5 ”喷泉 模型 
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9.1.3 ”软件 开发 方法 
软件 开发 方法 是 一 种 使 用 早已 定义 好 的 技术 集 及 符号 表示 习惯 来 组 织 软件 生产 的 过 程 。 
1， 结构 化 方法 


结构 化 方法 由 结构 化 分 析 、 结 构 化 设计 、 结 构 化 程序 设计 构成 ， 它 是 一 种 面向 数据 流 的 开 
发 方法 。 结 构 化 分 析 是 根据 分 解 与 抽象 的 原则 ， 按 照 系统 中 数据 处 理 的 流程 ， 用 数据 流 图 来 建 
立 系 统 的 功能 模型 ， 从 而 完成 需求 分 析 工 作 。 结 构 化 设计 是 根据 模块 独立 性 准则 、 软 件 结构 优 
化 准则 将 数据 流 图 转换 为 软件 的 体系 结构 ， 用 软件 结构 图 来 建立 系统 的 物理 模型 ， 实 现 系统 的 
概要 设计 。 结 构 化 程序 设计 是 根据 结构 程序 设计 原理 ， 将 每 个 模块 的 功能 用 相应 的 标准 控制 结 
构 表示 出 来 ， 从 而 实现 详细 设计 。 

结构 化 方法 总 的 指导 思想 是 自 顶 向 下 、 逐 层 分 解 ， 它 的 基本 原则 是 功能 的 分 解 与 抽象 。 它 
是 软件 工程 中 最 早出 现 的 开发 方法 ， 特 别 适合 于 数据 处 理 领 域 的 问题 ， 但 是 不 适合 解决 大 规模 
的 、 特 别 复杂 的 项 目 ， 且 难以 适应 需求 的 变化 。 


2. 原型 化 方法 


并 非 所 有 的 需求 都 能 够 预先 定义 ， 而 且 反 复 修改 是 不 可 避免 的 。 之 所 以 能 够 采用 原型 化 方 
法 是 因为 开发 工具 的 快速 发 展 ， 使 得 可 以 迅速 地 开发 出 一 个 可 以 让 用 户 看 得 见 、 摸 得 着 的 系统 
框架 ， 这 样 ， 对 于 计算 机 不 是 很 熟悉 的 用 户 就 可 以 根据 这 个 样板 提出 自己 的 需求 。 开 发 原型 化 
系统 首先 确定 用 户 需 求 ， 开 发 原始 模型 ， 然 后 征求 用 户 对 初始 原型 的 改进 意见 ， 并 根据 意见 修 
改 原 型 。 

原型 化 开发 比较 适合 于 用 户 需 求 不 清 、 业 务 理论 不 确定 、 需 求 经 常 变化 的 情况 。 当 系统 规 
模 不 是 很 大 也 不 太 复杂 时 ， 采 用 该 方法 是 比较 好 的 。 


3. 面向 对 象 开发 方法 


面向 对 象 开 发 方法 的 基本 出 发 点 是 尽 可 能 按照 人 类 认识 世界 的 方法 和 思维 方法 来 分 析 和 
解决 问题 。 客 观 世 界 是 由 许多 具体 的 事物 、 事 件 、 概 念 和 规则 组 成 ， 这 些 均 可 被 看 成 对 象 ， 面 
向 对 象 方法 正 是 以 对 象 作为 最 基本 的 元 素 ， 它 也 是 分 析 问 题 、 解 决 问题 的 核心 。 
面向 对 象 开发 方法 包括 面向 对 象 分 析 、 面 向 对 象 设计 和 面向 对 象 实现 。 面 向 对 象 开 发 方法 
有 Booch 方法 、Coad 方法 和 OMT 方法 等 。 为 了 统一 各 种 面向 对 象 方法 的 术语 、 概 念 和 模型 ， 
1997 年 推出 了 统一 建 模 语言 (Unified Modeling Language，UML )。 它 是 面向 对 象 的 标准 建 模 语 
言 ， 通 过 统一 的 语义 和 符号 表示 ， 使 各 种 方法 的 建 模 过 程 和 表示 统一 起 来 ， 已 成 为 面向 对 象 建 
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模 的 工业 标准 。 
4. 敏捷 方法 


敏捷 开发 的 总 体 目标 是 通过 “ 尽 可 能 早 地 、 持 续 地 对 有 价值 的 软件 的 交付 ”使 客户 满意 。 
通过 在 软件 开发 过 程 中 加 入 灵活 性 ， 敏 捷 方法 可 以 使 用 户 能 够 在 开发 周期 的 后 期 增加 或 改变 
敏捷 过 程 的 典型 方法 有 很 多 ， 每 一 种 方法 基于 一 套 原则 ， 这 些 原 则 实现 了 敏捷 方法 所 宣称 
的 理念 (敏捷 宣言 )。 这 些 方法 如 下 。 

1) 极限 编程 

极限 编程 (Extreme Programming，XP) 是 一 种 轻 量 级 (敏捷 )、 高 效 、 低 风险 、 和 柔性、 可 
预测 的 、 科 学 的 软件 开发 方式 。 极 限 编程 中 有 四 个 核心 价值 观 : 沟通 (Communication)、 简 单 
(Simplicity)、 反馈 (Feedback)、 勇气 (Courage), 此 外 还 扩展 了 第 五 个 价值 观 : 谦逊 (Modesty)。 
它 由 价值 观 、 原 则 、 实 践 和 行为 4 个 部 分 组 成 ， 彼 此 相互 依赖 、 关 联 ， 并 通过 行为 贯穿 于 整个 
生存 周期 。 

XP 的 5 个 原则 : 快速 反馈 、 简 单 性 假设 、 逐 步 修改 、 提 倡 更改 和 优质 工作 。 

XP 的 12 个 最 佳 实践 : 计划 游戏 〈 快 速 制定 计划 、 随 着 细节 的 不 断 变化 而 完善 )、 小 型 发 
布 (系统 的 设计 要 能 够 尽 可 能 早 地 交付 )、 隐 喻 (找到 合适 的 比喻 传达 信息 )、 简 单 设计 只 处 
里 当前 的 需求 ， 使 设计 保持 简单 )、 测 试 先 行 〈 先 写 测试 代码 ， 然 后 再 编写 程序 )、 重 构 (重新 
审视 需求 和 设计 ， 重 新 明确 地 描述 它们 以 符合 新 的 和 现 有 的 需求 )、 结 队 编 程 、 集 体 代码 所 有 
制 、 持 续集 成 (可 以 按 日 甚至 按 小 时 为 客户 提供 可 运行 的 版 本 )、 每 周 工作 40 个 小 时 、 现 场 客 
户 和 编码 标准 。 

2) 水 唱法 (Crystal) 

该 方法 认为 每 一 个 不 同 的 项 目 都 需要 一 套 不 同 的 策略 、 约 定 和 方法 论 。 

3) 并 列 争 求法 (Scrum) 

该 方法 使 用 和 迭代 的 方法 ， 其 中 把 每 30 天 一 次 的 迭代 称 为 一 个 “冲刺 ” 并 按 需 求 的 优先 级 
别 来 实现 产品 。 多 个 自 组 织 和 自治 的 小 组 并 行 地 递增 实现 产品 。 协 调 是 通过 简短 的 日 常情 况 会 
议 来 进行 ， 就 像 橄榄 球 中 的 “并 列 争 球 ”。 

4) 自 适应 软件 开发 “ASD) 

该 方法 有 6 个 基本 的 原则 : 有 一 个 使 命 作为 指导 ; 特征 被 视 为 客户 价值 的 关键 点 ; 过 程 中 
的 等 待 是 很 重要 的 ， 因 此 “ 重 做 ”与 “做 ”同样 关键 ， 变 化 不 被 视 为 改正 ， 而 是 被 视 为 对 软件 
开发 实际 情况 的 调整 ， 确 定 的 交付 时 间 迫 使 开发 人 员 认 真 考虑 每 一 个 生产 的 版 本 的 关键 需求 ; 
风险 也 包含 其 中 。 
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9.1.4 软件 项 目 管理 


软件 项 目 管理 的 对 象 是 软件 项 目 。 为 了 使 软件 项 目 开发 获得 成 功 ， 必 须 对 软件 开发 项 目的 
作 范 围 、 可 能 直到 的 风险 、 需 要 的 资源 “人 、 硬 /软件 )、 要 实现 的 任务 、 经 历 的 里 程 碑 、 花 
费 的 工作 量 成本) 以 及 进度 的 安排 等 做 到 心中 有 数 。 而 软件 项 目 管理 可 以 提供 这 些 信息 。 这 
种 管理 的 范围 覆盖 了 整个 软件 工程 过 程 ， 即 开始 于 技术 工作 开始 之 前 ， 在 软件 从 概念 到 实现 的 
过 程 中 持续 进行 ， 最 后 终止 于 软件 工程 过 程 结束 。 


1， 成 本 估算 


由 于 软件 具有 可 见 性 差 、 定 量化 难 等 特殊 性 ， 因 此 很 难 在 项 目 完成 前 准确 地 估算 出 开发 
软件 所 需 的 工作 量 和 费用 。 通 常 可 以 根据 以 往 开发 类 似 软件 的 经 验 〈 也 可 以 是 别人 的 经 验 ) 来 
进行 成 本 估算 。 也 可 以 将 软件 项 目 划分 成 若干 个 子 系统 或 按照 软件 生存 周期 的 各 个 阶段 分 别 
估算 其 成 本 ， 然 后 汇总 出 整个 软件 的 成 本 。 此 外 ， 还 可 以 使 用 经 验 公式 和 成 本 估算 模型 来 进 
行 估算 。 

1) 成 本 估算 方法 

(1) 自 项 向 下 估算 方法 。 该 方法 是 估算 人 员 参 照 以 前 完成 的 项 目 所 耗费 的 总 成 本 (或 总 工 
作 量 ) ， 来 推算 将 要 开发 的 软件 的 总 成 本 或 总 工作 量 ) ， 然 后 把 它们 按 阶 段 、 步 骤 和 工作 单 
元 进行 分 配 。 这 种 方法 的 优点 是 对 系统 级 工作 的 重视 ， 所 以 估算 中 不 会 遗漏 诸如 集成 、 配 置 
管理 之 类 的 系统 级 事务 的 成 本 估算 ， 且 估算 工作 量 小 、 速 度 快 。 它 的 缺点 是 往往 不 清楚 低级 
别 上 的 技术 性 困难 问题 ， 而 这 些 困 难 将 会 使 成 本 上 升 。 

(2) 自 底 向 上 估算 方法 。 该 方法 是 将 待 开 发 的 软件 细 分 ， 分 别 估算 每 一 个 子 任务 所 需要 的 
开发 工作 量 ， 然 后 将 它们 加 起 来 ， 得 到 软件 的 总 开发 量 。 这 种 方法 的 优点 是 对 每 一 部 分 的 估 
算 工作 交 给 负责 该 部 分 工作 的 人 来 做 ， 所 以 估算 较为 准确 。 其 缺点 是 其 估算 往往 缺少 各 项 子 
任务 之 间 相 互联 系 所 需要 的 工作 量 和 与 软件 开发 有 关 的 系统 级 工作 量 ， 所 以 估算 往往 偏 低 。 

(3) 差别 估算 方法 。 该 方法 是 将 待 开 发 项 目 与 一 个 或 多 个 已 完成 的 类 似 项 目 进行 比较 ， 找 
出 与 某 个 相 类 似 项 目的 若干 不 同 之 处 ， 并 估算 每 个 不 同 之 处 对 成 本 的 影响 ， 导 出 待 开 发 项 目 
的 总 成 本 。 该 方法 的 优点 是 可 以 提高 估算 的 准确 度 ， 缺 点 是 不 容易 明确 “差别 ”的 界限 。 

(4) 其 他 估算 方法 。 主 要 有 专家 估算 法 、 类 推 估算 法 和 算式 估算 法 等 。 

。 专家 估算 法 : 依靠 一 个 或 多 个 专家 对 要 求 的 项 目 做 出 估算 ， 其 精确 性 取决 于 专家 估算 

项 目的 定性 参数 的 了 解 和 他 们 的 经 验 。 
。 类 推 估算 法 : 在 自 顶 向 下 的 方法 中 ， 类 推 估算 法 将 估算 项 目的 总 体 参 数 与 类 似 项 目 进 
行 直接 比较 得 到 结果 ; 在 自 底 向 上 方法 中 ， 类 推 估算 法 是 在 两 个 具有 相似 条 件 的 工作 
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单元 之 间 进 行 。 
。 算式 估算 法 : 专家 估算 法 和 类 推 估算 法 的 缺点 在 于 它们 依靠 带 有 一 定 盲 目 性 和 主观 性 
的 猜测 对 项 目 进行 估算 。 算 式 估算 法 则 是 企图 避免 主观 因素 的 影响 。 用 于 估算 的 方法 
有 两 种 基本 类 型 : 由 理论 导出 和 由 经 验 导出 。 
2) 成 本 估算 模型 
常用 的 软件 成 本 估算 模型 有 Putnam 模型 和 COCOMO 模型 。Putnam 模型 是 一 种 动态 多 变 
量 模型 ， 它 是 假设 在 软件 开发 的 整个 生存 期 中 工作 量 有 特定 的 分 布 。 COCOMO 模型 是 最 精确 、 
最 易于 使 用 的 成 本 估算 模型 之 一 。COCOMO 模型 可 以 分 为 如 下 3 种 。 

(1) 基本 COCOMO 模型 。 是 一 个 静态 单 变量 模型 ， 它 是 对 整个 软件 系统 进行 估算 。 

(2) 中 级 COCOMO 模型 。 是 一 个 静态 多 变量 模型 ， 它 将 软件 系统 模型 分 为 系统 和 部 件 两 
个 层次 ， 系 统 由 部 件 构 成 ， 它 把 软件 开发 所 需 人 力 (成 本 ) 看 作 是 程序 大 小 和 一 系列 “成 本 驱 
动 属性 ”的 函数 。 

(3) 详细 COCOMO 模型 。 它 将 软件 系统 模型 分 为 系统 、 子 系统 和 模块 三 个 层次 ， 它 除 包 
括 中 级 模型 所 考虑 的 因素 外 , 还 考虑 了 在 需求 分 析 、 软件 设计 等 每 一 步 的 成 本 驱动 属性 的 影响 。 


2， 风险 分 析 


当 在 软件 工程 环境 中 考虑 风险 时 ， 主 要 是 基于 关心 未 来 、 关 心 变化 、 关 心 选择 这 三 个 概念 
提出 的 。 在 进行 软件 工程 分 析 时 ， 项 目 管理 人 员 要 进行 4 种 风险 评估 活动 ， 包 括 建立 表示 风险 
概念 的 尺度 ， 描 述 风险 引起 的 后 果 ， 估 计 风 险 影响 的 大 小 ， 确 定 风险 估计 的 正确 性 。 

风险 分 析 实 际 上 是 4 个 不 同 的 活动 : 风险 识别 ， 风 险 预测 ， 风 险 评估 和 风险 控制 。 

1) 风险 识别 

风险 识别 是 试图 系统 化 地 确定 对 项 目 计划 《估算 、 进 度 、 资 源 分 配 ) 的 威胁 。 风 险 识别 的 
一 种 方法 是 建立 风险 条 目 检查 表 。 该 检查 表 可 以 用 于 识别 风险 ， 并 使 得 人 们 集中 来 识别 下 列 常 
见 的 已 知 的 及 可 预测 的 风险 。 

(1) 产品 规模 。 与 要 建造 或 要 修改 的 软件 的 总 体 规模 相关 的 风险 。 

(2) 商业 影响 。 与 管理 或 市 场所 加 诸 的 约束 相关 的 风险 。 

(3) 客户 特性 。 与 客户 的 素质 以 及 开发 者 和 客户 定期 通信 的 能 力 相 关 的 风险 。 

(4) 过 程 定义 。 与 软件 过 程 被 定义 的 程度 以 及 它们 被 开发 组 织 所 遵守 的 程序 相关 的 风险 。 

(5) 开发 环境 。 与 用 以 构建 产品 的 工具 的 可 用 性 及 质量 相关 的 风险 。 

(6) 构建 的 技术 。 与 待 开发 软件 的 复杂 性 及 系统 所 包含 技术 的 “新 奇 性 ”相关 的 风险 。 

(7) 人 员 数 目 及 经 验 。 与 参与 工作 的 软件 工程 师 的 总 体 技术 水 平 及 项 目 经 验 相 关 的 风险 。 

2) 风险 预测 

风险 预测 ， 又 称 风险 估算 ， 它 从 两 个 方面 评估 一 个 风险 : 风险 发 生 的 可 能 性 或 概率 ; 以 及 
如 果 风 险 发 生 了 ， 所 产生 的 后 果 。 通 常 ， 项 目 计划 人 员 与 管理 人 员 、 技 术 人 员 一 起 进行 如 下 所 
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述 的 4 种 风险 预测 活动 。 

(1) 建立 一 个 尺度 或 标准 ， 以 反映 风险 发 生 的 可 能 性 。 

(2) 描述 风险 的 后 果 。 

(3) 估计 风险 对 项 目 和 产品 的 影响 。 

(4) 标注 风险 预测 的 整体 精确 度 ， 以 免 产 生 误解 。 

3) 风险 评估 

一 种 对 风险 评估 很 有 用 的 技术 就 是 定义 风险 参照 水 准 。 对 于 大 多 数 软件 项 目 来 说 ， 成 本 、 
进度 和 性 能 就 是 三 种 典型 的 风险 参照 水 准 。 也 就 是 说 ,对 于 成 本 超支 、 进度 延 期 、 性 能 降低 (或 
它们 的 某 种 组 合 )， 有 一 个 表明 导致 项 目 终止 的 水 准 。 
在 进行 风险 评估 时 ， 需 要 建立 (zx ) 形式 的 三 元 组 。 其 中 ，x; 表示 风险 ，1, 表 示 风 险 发 
生 的 概率 ，x, 则 表示 风险 产生 的 影响 。 在 风险 评估 过 程 中 ， 需 要 执行 以 下 4 个 步骤 。 

(1) 定义 项 目的 风险 参考 水 平 值 。 

(2) 建立 每 一 组 (x,,1,,Xx; ) 与 每 一 个 参考 水 平 值 之 间 的 关系 。 

(3) 预测 一 组 临界 点 以 定义 项 目 终止 区 域 ， 该 区 域 由 一 条 曲线 或 不 确定 区 域 所 界定 。 

(4) 预测 什么 样 的 风险 组 合 会 影响 参考 水 平 值 。 

4) 风险 控制 

这 一 步 的 所 有 风险 分 析 活 动 只 有 一 个 目的 一 一 辅助 项 目 组 建立 处 理 风险 的 策略 。 一 个 有 效 
的 策略 必须 考虑 风险 避免 、 风 险 监 控 、 风 险 管理 及 意外 事件 计划 方面 的 问题 。 

如 果 软 件 项 目 组 对 于 风险 采用 主动 的 方法 ， 则 避免 永远 是 最 好 的 策略 。 这 可 以 通过 建立 一 
个 风险 缓解 计划 来 达到 。 

风险 管理 策略 可 以 包含 在 软件 项 目 计划 中 ， 或 者 风险 管理 步骤 也 可 以 组 织 成 一 个 独立 的 风 
险 缓解 、 监 控 和 管理 计划 (RMMM 计划 )。RMMM 计划 将 所 有 风险 分 析 工作 文档 化 ， 并 由 项 
目 管理 者 作为 整个 项 目 计划 中 的 一 部 分 来 使 用 。 


3， 进度 管理 


进度 的 合理 安排 是 如 期 完成 软件 项 目的 重要 保证 ， 也 是 合理 分 配 资源 的 重要 依据 ， 因 此 进 
度 安排 是 管理 工作 的 一 个 重要 组 成 部 分 。 软 件 开发 项 目的 进度 安排 有 如 下 两 种 方式 。 

(1) 系统 最 终 交 付 日 期 已 经 确定 ， 软 件 开发 部 门 必须 在 规定 期 限 内 完成 。 

(2) 系统 最 终 交 付 日 期 只 确定 了 大 致 的 年 限 ， 最 后 交付 日 期 由 软件 开发 部 门 确定 。 

进度 安排 的 常用 图 形 描述 方法 有 Gantt 图 ( 甘 特 图 ) 和 项 目 计 划 评 审 技术 (Program 
Evaluation & Review Technique，PERT) 图 。 

1) Gantt 图 
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Gantt 图 是 一 种 简单 的 水 平 条 形 图 ， 它 以 日 历 为 基准 描述 项 目 任务 。 水 平 轴 表 示 日 历时 间 
线 〈 如 时 、 天 、 周 、 月 和 年 等 )， 每 个 条 形 表 示 一 个 任务 ， 任 务 名 称 垂直 地 列 在 左边 的 列 中 ， 
图 中 水 平 条 的 起 点 和 终点 对 应 水 平 轴 上 的 时 间 ， 分 别 表示 该 任务 的 开始 时 间 和 结束 时 间 ， 水 平 
条 的 长 度 表 示 完 成 该 任务 所 持续 的 时 间 。 当 日 历 中 同一 时 段 存在 多 个 水 平 条 时 ， 表 示 任 务 之 间 
的 并 发 。 图 9-6 所 示 的 Gantt 图 描述 了 三 个 任务 的 进度 安排 。 任 务 1 首先 开始 ， 完 成 它 需 要 6 
个 月 时 间 ; 任务 2 在 1 个 月 后 开始 ， 完 成 它 需要 9 个 月 时 间 ; 任务 3 在 6 个 月 后 开始 ， 完 成 它 
需要 5 个 月 时 间 。 


时 间 2016 年 
任务 1 月 |2 月 |3 月 | 4 月 | 5 月 |6 月 |7 月 | 8 月 | 9 月 | 10 月 | 月 | 12 月 

任务 1 1 

任务 2 
+ 于 

二 I I I I 

图 例 已 完成 的 任务 今天 

EEEE 未 完成 的 任务 


9-6 ”Gantt 图 实例 


Gantt 图 能 清晰 地 描述 每 个 任务 从 何 时 开始 ， 到 何 时 结束 ， 任 务 的 进展 情况 以 及 各 个 任务 
之 间 的 并 行 性 。 但 是 其 缺点 是 不 能 清晰 地 反映 出 各 任务 之 间 的 依赖 关系 ， 难 以 确定 整个 项 目的 
关键 所 在 ， 也 不 能 反映 计划 中 有 潜力 的 部 分 。 

2) PERT 图 

PERT 图 是 一 个 有 向 图 ， 图 中 的 箭头 表示 任务 ， 它 可 以 标 上 完成 该 任务 所 需 的 时 间 ;， 图 中 
的 节点 表示 流入 节点 的 任务 的 结束 ， 并 开始 流出 节点 的 任务 ， 这 里 把 节点 称 为 事件 。 只 有 当 流 
入 该 节点 的 所 有 任务 都 结束 时 ， 节 点 所 表示 的 事件 才 出 现 ， 流 出 节点 的 任务 才 可 以 开始 。 事 件 
本 身 不 消耗 时 间 和 资源 ， 它 仅 表示 某 个 时 间 点 。 一 个 事件 有 一 个 事件 号 和 出 现 该 事件 的 最 早 时 
刻 和 最 迟 时 刻 。 最 早 时 刻 表 示 在 此 时 刻 之 前 从 该 事件 出 发 的 任务 不 可 能 开始 ;最 迟 时 刻 表示 从 
该 事件 出 发 的 任务 必须 在 此 时 刻 之 前 开始 ， 否 则 整个 工程 就 不 能 如 期 完成 。 每 个 任务 还 可 以 有 
一 个 松弛 时 间 (Slack Time)， 表 示 在 不 影响 整个 工期 的 前 提 下 ， 完 成 该 任务 有 多 少 机 动 余地 。 
为 了 表示 任务 间 的 关系 ， 图 中 还 可 以 加 入 一 些 空 任务 〈 用 虚线 箭头 表示 )， 完 成 空 任务 的 时 间 
为 0。 图 9-7 是 PERT 图 的 一 个 实例 。 不 难看 出 ， 图 9-7 中 的 松弛 时 间 为 0 的 这 些 任 务 是 完成 整 
个 工程 的 关键 路 径 ， 其 事件 流 为 1 一 2 一 3 一 4 一 6 一 8 一 10 一 11。 

PERT 图 不 仅 给 出 了 每 个 任务 的 开始 时 间 、 结 束 时 间 和 完成 该 任务 所 需 的 时 间 ， 还 给 出 了 


图 424 项。 数据 库 系统 工程 师 教程 〈 第 3 版 ) 


任务 之 间 的 关系 ， 即 哪些 任务 完成 后 才能 开始 另外 一 些 任务 ， 以 及 如 期 完成 整个 了 


径 。 图 中 的 松弛 时 间 则 反映 了 完成 某 些 任务 时 可 以 推迟 其 开始 时 间或 延长 其 所 需 完成 的 时 间 。 


但 是 ，PERT 


[ 程 的 关键 路 


图 不 能 反映 任务 之 间 的 并 行 关系 。 


事件 号 。 最 早 时 刻 


任务 持续 时 间 
(松弛 时 间 ) 


最 迟 时 刻 


图 9-7 PERT 图 实例 


4， 人 员 管 理 


发 。 在 人 员 组 织 时 ， 应 考虑 软件 项 目的 特点 、 软 件 人 员 的 素质 等 多 方面 的 因素 。 
可 以 按 软件 项 目 对 软件 人 员 进行 分 组 ， 如 需求 分 析 组 、 设 计 组 、 编 码 组 、 测 试 组 和 维护 组 
等 ， 为 了 控制 软件 的 质量 ， 还 可 以 有 质量 保证 组 。 


程序 设计 小 组 的 组 织 形 式 也 可 以 有 多 种 ,为 


合理 地 组 织 好 参加 软件 项 目的 人 员 ， 有 利于 发 挥 每 个 人 的 作用 ， 有 利于 软件 项 目的 成 功 开 


主 程序 员 组 、 无 主 程序 员 组 和 层次 式 程序 员 组 等 。 


(1) 主 程序 员 组 。 主 程序 员 组 由 一 名 主 程序 员 、 一 名 后 备 程序 员 (Back Up Programmer)、 


一 名 资料 员 和 若干 名 程序 员 组 成 。 主 程序 员 由 经 验 丰富 、 能 力 强 的 高 级 程序 员 担任 ， 他 是 该 组 
织 的 技术 领导 和 项 目 负责 人 ， 全 面 负责 软件 项 目的 开发 。 后 备 程序 员 是 主 程序 员 的 助手 ， 协 助 


主 程序 员工 


文档 资料 、 程 序 清单 和 存储 介质 等 ， 还 编译 和 链接 代码 、 对 提交 的 所 有 模块 进行 


程序 员 则 集中 


精力 负责 完成 主 程序 员 分 配给 他 最 擅长 的 任务 一 一 编程 。 这 种 组 织 


E， 必 要 时 能 代替 主 程序 员工 作 。 资 料 员 负 责 保存 和 管理 所 有 的 软件 配置 元 素 ， 如 


初步 的 测试 。 
By 式 便于 集中 
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领导 ， 步 调 统一 ， 容 易 按 规范 办 事 ， 但 不 利于 发 挥 个 人 的 积极 性 。 

(2) 无 主 程序 员 组 。 无 主 程序 员 组 中 的 成 员 之 间 相 互 平 等 ， 工 作 目标 和 决策 都 由 全 体 成 员 
民主 讨论 ， 根 据 需 要 也 可 以 轮流 坐庄 。 这 种 组 民主 气氛 比较 足 ， 依 赖 个 人 的 成 分 少 ， 有 利于 发 
挥 每 个 人 的 积极 性 。 但 这 种 组 中 交流 量 大 ， 往 往 职责 不 明确 ， 出 了 问题 谁 也 不 负责 ， 而 且 不 利 
于 与 外 界 的 联系 。 

(3) 层次 式 程序 员 组 。 层 次 式 组 中 有 一 位 组 长 ， 组 长 负责 全 面 的 工作 ， 他 领导 若干 名 高 级 
程序 员 ， 每 个 高 级 程序 员 又 领导 若干 名 程序 员 。 这 种 组 适合 于 具有 层次 结构 特点 的 更 大 型 的 软 
件 项 目 ， 该 项 目 可 分 成 若干 个 子 项 目 ， 每 个 高 级 程序 员 负责 一 个 子 项 目 ， 然 后 再 对 子 项 目 分 解 ， 
并 分 配给 程序 员 。 


9.1.5 软件 工具 与 开发 环境 


来 辅助 软件 开发 、 运 行 、 维 护 、 管 理 和 支持 等 过 程 中 的 活动 的 软件 称 为 软件 工具 。 软 件 
开发 环境 是 指 支持 软件 产品 开发 的 软件 系统 ， 它 由 软件 工具 集 和 环境 集成 机 制 构 成 。 软 件 工具 
集 包 括 支持 软件 开发 相关 过 程 、 活 动 、 任 务 的 软件 工具 ， 以 对 软件 开发 提供 全 面 的 支持 。 环 境 
集成 机 制 为 工具 集成 和 软件 开发 、 维 护 和 管理 提供 统一 的 支持 ， 通 常 包 括 数据 集成 、 控 制 集成 
和 界面 集成 。 


1， 软 件 工具 


软件 工具 可 包括 支持 特定 过 程 模 型 和 开发 方法 的 工具 (如 支持 瀑布 模型 及 数据 流 方法 的 工 
具 、 支 持 面向 对 象 方法 的 工具 等 )、 独 立 于 模型 和 方法 的 工具 〈 如 界面 辅助 生成 工具 、 文 档 出 
版 工具 等 ) 以 及 管理 类 工具 和 针对 特地 领域 的 应 用 类 工具 。 这 些 工 具 可 分 为 贯穿 整个 开发 过 程 
的 工具 《如 项 目 管理 工具 ) 和 解决 软件 生存 周期 中 某 一 阶段 问题 的 工具 〈 如 软件 估算 工具 等 )。 
1) 软件 工具 的 分 类 
将 软件 工具 从 功能 上 进行 划分 ， 可 以 分 为 软件 开发 工具 、 软 件 维护 工具 、 软 件 管理 和 支 


G1) 软件 开发 工具 。 软 件 开发 工具 用 来 辅助 开发 人 员 进 行 软件 开发 活动 ， 包 括 需求 分 析 工 
具 、 设 计 工 具 、 编 码 与 排 错 工 具 等 。 

(2) 软件 维护 工具 。 软 件 维护 工具 用 来 辅助 维护 人 员 对 软件 代码 及 其 文档 进行 各 种 维护 活 
动 ， 包 括 版 本 管理 工具 、 文 档 分 析 工 具 、 开 发 信息 库 工 具 、 逆 向 工程 工具 和 再 工程 工具 等 。 

(3) 软件 管理 和 支持 工具 。 软 件 管理 和 支持 工具 用 来 辅助 管理 人 员 和 软件 支持 人 员 的 管理 
活动 和 支持 活动 ， 以 确保 软件 高 质量 的 完成 。 包 括 项 目 管理 工具 、 配 置 管理 工具 和 软件 评价 工 
具 等 。 
2) 软件 开发 工具 的 选择 
发 工具 的 选择 是 软件 项 目 成 功 的 要 素 之 一 。 对 软件 开发 工具 的 评价 和 选择 ， 要 参照 具体 
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软件 项 目 对 


发 了 


支持 等 方面 来 衡量 。 


模式 和 对 象 结构 ， 
架构 和 开发 人 员 ， 


以 及 管理 的 支撑 情况 ， 更 如 
以 及 最 终 用 户 来 评价 一 种 工具 的 适宜 程度 。 


[有 具 的 标准 和 要 求 ， 从 功能 、 易 用 性 、 稳 健 性 、 硬 件 要 求 和 性 能 ， 
发 工具 的 比较 没有 绝对 的 标准 。 评 价 一 种 开发 工具 ， 不 仅 要 看 它 对 设计 
要 的 是 要 针对 具体 的 使 用 环境 、 开 发 方法 、 软 件 


2， 软件 开发 环境 


以 及 服务 和 


软件 开发 环境 〈Software Development Environment) 是 支持 软件 产品 开发 的 软件 系统 。 它 


软件 


通过 环境 集成 机 制 ， 各 了 
界面 形式 ， 保 证 各 了 
同 工 作 提供 支持 。 
环境 信息 库 的 支持 


活动 得 到 连续 的 支持 ， 从 而 大 大 提高 了 软件 的 开发 效率 ， 提 高 了 软件 的 质量 。 
软件 开发 环境 的 特征 如 下 。 
(1) 环境 的 服务 是 集成 的 。 软 件 开发 环境 应 支持 多 种 集成 机 制 ， 如 平台 集成 、 数 据 集成 、 
界面 集成 、 控 制 集成 和 过 程 集成 等 。 
(2) 环境 应 支持 小 组 工作 方式 ， 并 为 其 提供 配置 管理 。 

(3) 环境 的 服务 可 用 于 支持 各 种 软件 开发 活动 ， 包 括 分 析 、 设 计 、 编 程 、 测 试 、 调 试 和 文 
档 等 。 


件 


软件 
数据 集成 和 控制 


存 周 


和 


集成 型 开发 环境 是 一 种 把 支持 多 种 软件 开发 方法 和 开发 模型 的 软件 了 


有 具 集 和 环境 集成 机 制 构成 ， 前 者 用 来 支持 软件 开发 的 相关 过 程 、 活 动 和 任务 ;后 者 为 
工具 集成 和 软件 开发 、 维 护 和 管理 提供 统一 的 支持 ,通常 包括 数据 集成 、 控 制 集成 和 界面 集成 。 
[ 具 用 统一 的 数据 接口 规范 存储 或 访问 环境 信息 库 ， 各 工具 采 
[ 具 界 面 的 一 致 性 ， 同 时 为 各 工具 或 开发 活动 之 间 的 通信 、 切 换 、 调 度 和 协 
在 软件 开发 环境 中 进行 软件 开发 ， 可 以 使 用 环境 中 提供 的 各 种 工具 ， 同 时 在 
下 ， 一 个 工具 所 产生 的 结果 信息 可 以 为 其 他 工具 利用 ， 使 得 软件 开 


统一 的 


发 的 各 项 


[ 具 集 成 在 一 起 的 软 


发 环境 。 这 种 环境 应 该 具有 开放 性 和 可 剪裁 性 。 开 放 性 为 环境 外 的 工具 集成 到 环境 中 来 提 
供 了 方便 ， 可 剪裁 性 可 根据 不 同 的 应 用 和 不 同 的 用 户 需 求 进行 剪裁 ， 以 形成 特定 的 开发 环境 。 


3， 集成 计算 机 辅助 软件 工程 


随 着 软件 


工程 (Integrated Computer Aided Software Engineering，ICASE) 阶段 。ICASE 不 仅 提供 


期 各 阶段 ， 保 证 和 4 


发 了 


[有 具 的 积累 与 自动 化 了 


发 工具 槽 〈 用 于 连接 新 的 工具 )。 
ICASE 的 信息 库 不 仅 定义 了 面向 对 象 的 数据 库 管 理 系统 ， 提 供 了 数据 -数据 集成 机 制 ， 还 


[ 具 的 增多 , 软件 开发 环境 已 经 进入 了 集成 计算 机 辅 由 


由 


集成 ， 还 提供 了 一 组 用 户 界 面 管理 设施 和 工具 ， 包 括 垂直 工具 集 (支持 软件 生 
成 信息 的 完备 性 和 一 致 性 )、 水 平 工具 集 〈 用 于 不 同 的 软件 开发 方法 ) 
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建立 了 可 以 被 环境 中 所 有 工具 访问 的 数据 模型 , 提供 了 数据 -工具 集成 机 制 , 实现 了 配置 管理 功 
E。ICASE 的 进一步 发 展 则 是 与 软件 开发 方法 的 结合 ， 以 及 智能 化 的 ICASE。 


9.2 ”系统 分 析 基 础 知识 


系统 分 析 的 目的 是 为 项 目 团队 提供 对 触发 项 目的 问题 和 需求 更 全 面 的 理解 。 因 此 需要 研究 
和 分 析 业 务 领域 ， 以 获得 对 有 什么 、 没 有 什么 以 及 需要 什么 等 内 容 的 深入 理解 。 系 统 分 析 阶 段 
要 求 与 系统 用 户 一 起 工作 以 便 清楚 地 定义 购买 或 开发 的 新 系统 的 业务 需求 和 预期 。 


9.2.1 系统 分 析 概 述 


1， 系统 分 析 的 目的 和 任务 


系统 分 析 的 主要 任务 是 对 现行 系统 进一步 详细 调查 ， 将 调查 中 所 得 到 的 文档 资料 集中 ， 对 
组 织 内 部 整体 管理 状况 和 信息 处 理 过 程 进行 分 析 ， 为 系统 开发 提供 所 需 资 料 ， 并 提交 系统 方案 
说 明 书 。 系 统 分 析 侧 重 于 从 业务 全 过 程 的 角度 进行 分 析 ， 主 要 内 容 有 业务 和 数据 的 流程 是 否 通 
畅 ， 是 否 合理 ， 数 据 、 业 务 过 程 和 组 织 管理 之 间 的 关系 ;， 原 系统 管理 模式 改革 和 新 系统 管理 方 
法 的 实现 是 否 具有 可 行 性 等 。 

确定 的 分 析 结 果 包括 开发 者 对 于 现 有 组 织 管理 状况 的 了 解 ， 用 户 对 信息 系统 功能 的 需求 ， 
数据 和 业务 流程 ， 管 理 功能 和 管理 数据 指标 体系 以 及 新 系统 拟 改动 和 新 增 的 管理 模型 等 。 

最 后 ， 提 出 信息 系统 的 各 种 设想 和 方案 ， 并 对 所 有 的 设想 和 方案 进行 分 析 、 研 究 、 比 较 、 
判断 和 选择 ， 获 得 一 个 最 优 的 新 系统 的 逻辑 模型 ， 并 在 用 户 理解 计算 机 系统 的 工作 流程 和 处 理 
方式 的 情况 下 ， 将 它 明确 地 表达 成 书面 资料 一 一 系统 分 析 报 告 ， 即 系统 方案 说 明 书 。 


2， 系统 分 析 的 主要 阶段 


系统 分 析 主 要 包括 范围 定义 、 问 题 分 析 、 需 求 分 析 、 逻 辑 设计 以 及 决策 分 析 等 阶段 。 

(1) 范围 定义 阶段 (计划 阶段 〉 是 典型 系统 开发 过 程 的 第 一 个 阶段 。 该 阶段 回答 这 样 一 个 
问题 “这 个 项 目 看 起 来 是 否 值得 ? ”范围 定义 阶段 的 持续 时 间 一 般 很 短 。 对 大 多 数 项 目 来 说 ， 
整个 阶段 不 应 该 超过 2~3 天 。 

(2) 问题 分 析 阶 段 的 目标 是 充分 研究 和 理解 问题 域 并 全 面 分 析 其 中 存在 的 问题 、 机 会 和 约 
束 条 件 。 该 阶段 要 回答 的 问题 是 :“ 真 的 值得 解决 这 些 问题 吗 ? ”和 “ 真 的 值得 构建 一 个 新 系 
统 吗 ? ”这 个 阶段 也 被 称 为 可 行 性 分 析 阶 段 、 详 细 研 究 阶段 等 。 
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(3) 需求 分 析 阶 段 为 一 个 新 系统 定义 业务 需求 。 该 阶段 需要 回答 的 问题 是 :“ 用 户 需要 什 
么 ? 想 从 一 个 新 系统 中 得 到 什么 ? ”这 个 阶段 是 任何 一 个 信息 系统 成 功 的 关键 ! 

(4) 逻辑 设计 阶段 为 一 个 新 的 或 者 改进 的 系统 绘制 各 种 系统 模型 来 记录 和 需求。 从 某 种 意义 
来 说 ， 逻 辑 设计 验证 了 前 面 阶段 建立 的 需求 。 逻 辑 设 计 阶段 的 任务 包括 : 结构 化 功能 需求 、 建 
立功 能 需求 的 原型 、 验 证 功能 需求 以 及 定义 验收 测试 用 例 。 

(5) 决策 分 析 阶 段 实现 新 系统 的 候选 方案 ， 分 析 那 些 候选 方案 并 推荐 一 个 将 被 设计 、 构 造 
和 实现 的 目标 系统 。 在 决策 分 析 阶 段 ， 有 必要 确定 各 种 可 选 的 方案 ， 分 析 它们 ， 然 后 根据 分 析 
结果 推荐 最 佳 方案 。 


9.2.2 ”需求 分 析 


需求 分 析 是 软件 生存 周期 中 相当 重要 的 一 个 阶段 。 由 于 开发 人 员 熟 悉 计 算 机 但 不 熟悉 应 用 
领域 的 业务 ， 用 户 熟 悉 应 用 领域 的 业务 但 不 熟悉 计算 机 ， 因 此 对 于 同一 个 问题 ， 开 发 人 员 和 用 
户 之 间 可 能 存在 认识 上 的 差异 。 在 需求 分 析 阶 段 ， 通 过 开发 人 员 与 用 户 之 间 的 广泛 交流 ， 不 断 
澄清 一 些 模糊 的 概念 ， 最 终 形成 一 个 完整 的 、 清 晰 的 、 一 致 的 需求 说 明 。 可 以 说 ， 需 求 分 析 的 
好 坏 将 直接 影响 到 所 开发 的 软件 的 成 败 。 


1， 需 求 分 析 的 任务 


需求 分 析 主 要 是 确定 待 开发 软件 的 功能 、 性 能 、 数 据 和 界面 等 要 求 。 具 体 来 说 ， 可 有 以 下 
五 个 方面 。 

(1) 确定 软件 系统 的 综合 要 求 。 主 要 包括 系统 界面 要 求 、 系 统 的 功能 要 求 、 系 统 的 性 能 要 
求 、 系 统 的 安全 和 保密 性 要 求 、 系 统 的 可 靠 性 要 求 、 异 常 处 理 要 求 和 将 来 可 能 提出 的 要 求 。 其 
中 ， 系 统 界 面 要 求 是 指 描述 软件 系统 的 外 部 特性 ， 即 系统 从 外 部 输入 哪些 数据 ， 系 统 向 外 部 输 
出 哪些 数据 ;系统 的 功能 要 求 是 要 列 出 软件 系统 必须 完成 的 所 有 功能 ;系统 的 性 能 要 求 是 指 系 
统 对 响应 时 间 、 吞 吐 量 、 处 理 时 间 、 对 主 存 和 外 存 的 限制 等 方面 的 要 求 ， 系 统 的 运行 要 求 是 指 
对 硬件 、 支 撑 软 件 和 数据 通信 接口 等 方面 的 要 求 ， 异 常 处 理 要 求 通常 是 指 在 运行 过 程 中 出 现 异 
常情 况 时 应 采取 的 行动 以 及 希望 显示 的 信息 ， 例 如 临时 性 或 永久 性 的 资源 故障 ， 不 合法 或 超出 
范围 的 输入 数据 、 非 法 操作 和 数组 越界 等 异常 情况 的 处 理 要 求 ， 将 来 可 能 提出 的 要 求 主要 是 为 
将 来 可 能 的 扩充 和 修改 做 准备 。 
(2) 分 析 软 件 系 统 的 数据 要 求 。 包 括 基 本 数据 元 素 、 数 据 元 素 之 间 的 逻辑 关系 、 数 据 量 和 
峰值 等 。 常 用 的 数据 描述 方法 是 实体 -关系 模型 (E-R 模型 )。 
(3) 导出 系统 的 逻辑 模型 。 在 结构 化 分 析 方法 中 可 用 数据 流 图 来 描述 ， 在 面向 对 和 象 分 析 方 
法 中 可 用 类 模型 来 描述 。 

(4) 修正 项 目 开发 计划 。 在 明确 了 用 户 的 真正 需求 后 ， 可 以 更 准确 地 估算 软件 的 成 本 和 进 
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度 ， 从 而 修正 项 目 开 发 计划 。 

(5) 如 有 必要 ， 可 开发 一 个 原型 系统 。 对 一 些 需求 不 够 明确 的 软件 ， 可 以 先 开 发 一 个 原型 
系统 ， 以 验证 用 户 的 需求 。 

在 此 需要 强调 的 是 ， 需 求 分 析 阶 段 主要 解决 “做 什么 ”的 问题 ， 而 “怎么 做 ” 则 是 由 设计 
阶段 来 完成 。 


2. 需求 的 分 类 


软件 需求 就 是 系统 必须 完成 的 事 以 及 必须 具备 的 品质 。 软 件 需 求 包括 功能 需求 、 非 功能 需 
求 和 设计 约束 三 方面 的 内 容 。 

(1) 功能 需求 。 所 开发 的 软件 必须 具备 什么 样 的 功能 。 

(2) 非 功 能 需求 。 是 指 产品 必须 具备 的 属性 或 品质 ， 如 可 靠 性 、 性 能 、 响 应 时 间 、 容 错 性 
和 扩展 性 等 。 

(3) 设计 约束 。 也 称 为 限制 条 件 、 补 充 规约 ， 这 通常 是 对 解决 方案 的 一 些 约束 说 明 。 


9.2.3 ”结构 化 分 析 方 法 


结构 化 分 析 (Structured Analysis，SA) 方法 是 一 种 面向 数据 流 的 需求 分 析 方法 ， 适 用 于 分 
析 大 型 数据 处 理 系统 ， 是 一 种 简单 、 实 用 的 方法 ， 现 在 已 经 得 到 广泛 的 使 用 。 
结构 化 分 析 方法 的 基本 思想 是 自 项 向 下 逐 层 分 解 。 分 解 和 抽象 是 人 们 控制 问题 复杂 性 的 两 
种 基本 手段 。 对 于 一 个 复杂 的 问题 ， 人 们 很 难 一 下 子 考虑 问题 的 所 有 方面 和 全 部 细节 ， 通 常 可 
以 把 一 个 大 问题 分 解 成 若干 个 小 问题 ， 每 个 小 问题 再 分 解 成 若干 个 更 小 的 问题 ， 经 过 多 次 逐 层 
分 解 ， 每 个 最 底层 的 问题 都 是 足够 简单 ， 容 易 解决 的 ， 于 是 复杂 的 问题 也 就 迎刃而解 了 。 这 个 
过 程 就 是 分 解 的 过 程 。 
SA 方法 的 分 析 结 果 由 以 下 几 部 分 组 成 : 一 套 分 层 的 数据 流 图 、 一 本 数据 词典 、 一 组 小 说 
明 《〈 也 称 加 工 罗 辑 说 明 )、 补 充 材料 。 


1， 数 据 流 图 


数据 流 图 或 称 数据 流程 图 (Data Flow Diagram，DFD)， 是 一 种 便于 用 户 理解 、 分 析 系 统 
数据 流程 的 图 形 工 具 。 它 摆脱 了 系统 的 物理 内 容 ， 精 确 地 在 逻辑 上 描述 系统 的 功能 、 输 入 、 输 
出 和 数据 存储 等 ， 是 系统 逻辑 模型 的 重要 组 成 部 分 。 

1) DFD 的 基本 成 分 

DFD 的 基本 成 分 包括 数据 流 、 加 工 、 数 据 存储 和 外 部 实体 ， 可 分 别 用 图 9-8 (a) 一 〈d) 
表示 。 
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(1) 数据 流 。 数 据 流 由 一 组 固定 成 分 的 数据 组 成 ， 表 示 数 据 的 流向 。 值 得 注意 的 是 ， 
DFD 中 描述 的 是 数据 流 ， 而 不 是 控制 流 。 除 了 流向 数据 存储 或 从 数据 存储 流出 的 数据 流 不 
必 命名 外 ， 每 个 数据 流 都 必须 有 一 个 合适 的 名 字 ， 以 反映 该 数据 流 的 含义 。 

(2) 加 工 。 加 工 描述 了 输入 数据 流 到 输出 数据 流 之 间 的 变换 ， 也 就 是 输入 数据 流 经 过 
什么 处 理 后 变 成 了 输出 数据 流 。 每 个 加 工 有 一 个 名 字 和 编号 。 编 号 能 反映 出 该 加 工 位 于 分 
层 DFD 中 的 哪个 层次 和 哪 张 图 中 ， 也 能 够 看 出 它 是 哪个 加 工分 解 出 来 的 子 加 工 。 


E | [ J]0O 


(a) 外 部 实体 (External Agent) (b) 加 工 《Process) 


(c) 数据 存储 (Data Store) (d) 数据 流 (Data Flow) 


一 


图 9-8 DFD 的 基本 成 分 


(3) 数据 存储 。 数 据 存储 用 来 表示 存储 的 数据 ， 每 个 数据 存储 都 有 一 个 名 字 。 

(4) 外 部 实体 。 外 部 实体 是 指 存在 于 软件 系统 之 外 的 人 员 或 组 织 ， 它 指出 系统 所 需 数 
据 的 发 源 地 和 系统 所 产生 的 数据 的 归宿 地 。 

2) 分 层 数据 流 图 的 画 法 

(1) 画 系统 的 输入 和 输出 。 把 整个 软件 系统 看 作 一 个 大 的 加 工 ， 然 后 根据 系统 从 哪些 外 部 
实体 接收 数据 流 ， 以 及 系统 发 送 数据 流 到 哪些 外 部 实体 ， 就 可 以 画 出 系统 的 输入 和 输出 图 ， 这 
张 图 称 为 顶层 图 。 

(2) 画 系 统 的 内 部 。 将 顶层 图 的 加 工分 解 成 若干 个 加 工 ， 并 用 数据 流 将 这 些 加 工 连接 起 来 ， 
使 得 顶层 图 中 的 输入 数据 经 过 若干 个 加 工 处 理 后 变换 成 顶层 图 的 输出 数据 流 。 这 张 图 称 为 0 层 
图 。 从 一 个 加 工 画 出 一 张 数据 流 图 的 过 程 实际 上 就 是 对 这 个 加 工 的 分 解 。 

可 以 用 下 述 的 方法 来 确定 加 工 : 在 数据 流 的 组 成 或 值 发 生变 化 的 地 方 应 画 一 个 加 工 ， 这 个 
加 工 的 功能 就 是 实现 这 一 变化 ; 也 可 根据 系统 的 功能 确定 加 工 。 
确定 数据 流 的 方法 : 当 用 户 把 若干 个 数据 看 作 一 个 单位 来 处 理 〈 这 些 数据 一 起 到 达 ， 一 起 
加 工 ) 时 ， 可 把 这 些 数据 看 成 一 个 数据 流 。 

对 于 一 些 以 后 某 个 时 间 要 使 用 的 数据 可 以 组 织 成 一 个 数据 存储 来 表示 。 

(3) 画 加工 的 内 部 。 把 每 个 加 工 看 作 一 个 小 系统 ， 该 加 工 的 输入 输出 数据 流 看 成 小 系统 的 
输入 输出 数据 流 。 于 是 可 以 用 与 画 0 层 图 同样 的 方法 画 出 每 个 加 工 的 DFD 子 图 。 


[ 漂 
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(4) 对 第 (3) 步 分 解 出 来 的 DFD 子 图 中 的 每 个 加 工 ， 重 复 第 (3) 步 的 分 解 ， 直 至 图 中 
尚未 分 解 的 加 工 都 足够 简单 〈 也 就 是 说 这 种 加 工 不 必 再 分 解 ) 为 止 。 至 此 ， 得 到 了 一 套 分 层 数 
据 流 图 。 
3) 对 图 和 加 工 进行 编号 

对 于 一 个 软件 系统 ， 其 数据 流 图 可 能 有 许多 层 ， 每 一 层 又 有 许多 张 图 。 为 了 区 分 不 同 的 加 
工 和 不 同 的 DFD 子 图 ， 应 该 对 每 张 图 和 每 个 加 工 进行 编号 ， 以 利于 管理 。 

父 图 与 子 图 

分 层 数据 流 图 里 的 某 张 图 〈 记 为 图 A) 中 的 某 个 加 工 可 用 另 一 张 图 〈 记 为 图 B) 来 分 
解 ， 称 图 A 是 图 B 的 父 图 ， 图 B 是 图 A 的 子 图 。 在 一 张 图 中 ， 有 些 加 工 需要 进一步 分 解 ， 有 
些 加 工 则 不 必 分 解 。 因 此 ， 如 果 父 图 中 有 n 个 加 工 ， 那 么 它 可 以 有 0~n 张 子 图 (这 些 子 图 位 
于 同一 层 )， 但 每 张 子 图 都 只 对 应 于 一 张 父 图 。 

(2) 编号 

@ 顶层 图 只 有 一 张 ， 图 中 的 加 工 也 只 有 一 个 ， 所 以 不 必 编 号 。 

@ 0 层 图 只 有 一 张 ， 图 中 的 加 工 号 可 以 分 别 是 0.1，0.2，… 或 者 是 1，2，… 

@ 子 图 号 就 是 父 图 中 被 分 解 的 加 工 号 。 

@ 图 的 加 工 号 由 图 号 、 圆 点 和 序号 组 成 。 

4) 实例 

某 考 务 处 理 系统 有 如 下 功能 。 

(1) 对 考生 送 来 的 报名 单 进行 检查 。 

(2) 对 合格 的 报名 单 进行 检查 。 

(3) 对 阅卷 站 送 来 的 成 绩 清单 进行 检查 ， 并 根据 考试 中 心 指定 的 合格 标准 审定 合格 者 。 

(4) 制作 考生 通知 单 〈 内 含 成 绩 合格 /不 合格 标志 ) 送 给 考生 。 

(5) 按 地 区 、 年 龄 、 文 化 程度 、 职 业 和 考试 级 别 等 进行 成 绩 分 类 统计 和 试题 难度 分 析 ， 产 
生 统 计 分 析 表 。 

该 考 务 处 理 系统 的 分 层 数据 流 图 如 图 9-9 所 示 。 

5) 应 注意 的 问题 

(1) 适当 地 为 数据 流 、 加 工 、 数 据 存储 、 外 部 实体 命名 ， 名 字 应 反映 该 成 分 的 实际 含义 ， 
避免 空洞 的 名 字 。 

(2) 画 数据 流 而 不 要 画 控制 流 。 

(3) 每 条 数据 流 的 输入 或 者 输出 是 加 工 。 

(4) 一 个 加 工 的 输出 数据 流 不 应 与 输入 数据 流 同 名 ， 即 使 它们 的 组 成 成 分 相同 。 

(5) 允许 一 个 加 工 有 多 条 数据 流 流向 另 一 个 加 工 ， 也 允许 一 个 加 工 有 两 个 相同 的 输出 数据 
流 流向 两 个 不 同 的 加 工 。 

(6) 保持 父 图 与 子 图 平衡 。 也 就 是 说 ， 父 图 中 某 加 工 的 输入 输出 数据 流 必 须 与 它 的 子 图 的 


完 
全 小 一 
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输入 输出 数据 流 在 数量 和 名 字 上 相同 。 值 得 注意 的 是 ， 如 果 父 图 的 一 个 输入 《或 输 则 


H ) 数据 流 


对 应 于 子 图 中 几 个 输入 《或 输出 ) 数据 流 ， 而 子 图 中 组 成 这 些 数据 流 的 数据 项 全 体 
中 的 这 一 个 数据 流 ， 那 么 它们 仍然 算是 平衡 的 。 


E 好 是 父 图 


2 
统计 成 绩 


合 成 错误 成 
格 绩 绩 清单 
标 清 
准 单 


(b) 0 层 图 


ee 


a 2.5 2.4 
难度 分 析 表 | | | 分 类 统计 分 类 统计 表 


(d) 1 层 图 
图 9-9 考 务 处 理 系统 分 层 数据 流 图 


统计 分 析 表 
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(7) 在 自 项 向 下 的 分 解 过 程 中 ， 若 一 个 数据 存储 首次 出 现时 只 与 一 个 加 工 有 关 ， 那 么 这 个 


数据 存储 应 作为 这 个 加 工 的 内 部 文件 而 不 必 画 出 。 

(8) 保持 数据 守恒 。 也 就 是 说 ， 一 个 加 工 所 有 输出 数据 流 中 的 数据 必须 能 从 该 加 工 的 输入 
数据 流 中 直接 获得 ， 或 者 是 通过 该 加 工 能 产生 的 数据 。 

(9) 每 个 加 工 必须 既 有 输入 数据 流 ， 又 有 输出 数据 流 。 

(10) 在 整套 数据 流 图 中 ， 每 个 数据 存储 必须 既 有 读 的 数据 流 ， 又 有 写 的 数据 流 。 但 在 某 
一 张 子 图 中 可 能 只 有 读 没 有 写 ， 或 者 只 有 写 没 有 读 。 


2， 数据 字典 (DD) 


数据 流 图 描述 了 系统 的 分 解 ， 但 没有 对 图 中 各 成 分 进行 说 明 。 数 据 字 典 就 是 为 数据 流 图 中 


的 每 个 数据 流 、 文 件 、 加 工 ， 以 及 组 成 数据 流 或 文件 的 数据 项 做 出 说 明 。 其 中 对 加 工 的 描述 称 


为 “小 说 明 ”， 也 可 以 称 为 “加 工 逻 辑 说 明 ”。 
1) 数据 字典 的 内 容 


数据 字典 有 以 下 4 类 条 目 : 数据 流 、 数 据 项 、 数 据 存储 和 基本 加 工 。 数 据 项 是 组 成 数据 流 
和 数据 存储 的 最 小 元 素 。 源 点 、 终 点 不 在 系统 之 内 ， 故 一 般 不 在 字典 中 说 明 。 

(1) 数据 流 条 目 。 数 据 流 条 目 给 出 了 DFD 中 数据 流 的 定义 ， 通 常 列 出 该 数据 流 的 各 组 成 
数据 项 。 在 定义 数据 流 或 数据 存储 组 成 时 ， 使 用 表 9-1 给 出 的 符号 。 


表 9-1 在 数据 字典 的 定义 式 中 出 现 的 符号 
举例 及 说 明 


落 
«< 


被 定义 为 

x=atb， 表 示 x 由 a 和 b 组 成 

x= [alb]， 表 示 x 由 a 或 b 组 成 

x= {a}， 表 示 x 由 0 个 或 多 个 a 组 成 

x=2{a}5 或 x= {a};, 表示 x 中 最 少 出 现 2 次 a， 最 多 出 
现 5$ 次 a。5，2 为 重复 次 数 的 上 、 下 限 


[a 
六 


可 选 x= (g) 表 示 a 可 在 x 中 出 现 ， 也 可 不 出 现 
基本 数据 元 素 | x=“a”， 表 示 x 是 取信 为 字符 a 的 数据 元 素 
x= 1.9， 表 示 x 可 取 1~9 中 任意 一 个 值 


(2) 数据 存储 条 目 。 数 据 存储 条 目 是 对 数据 存储 的 定义 。 
(3) 数据 项 条 目 。 数 据 项 条 目 是 不 可 再 分 解 的 数据 单位 。 
(4) 加 工 条 目 。 加 工 条 目 是 用 来 说 明 DFD 中 基本 加 工 的 处 理 逻 辑 的 ， 由 于 上 层 的 加 工 是 


下 层 的 基本 加 


分 解 而 来 ， 只 要 有 了 基本 加 工 的 说 明 ， 就 可 理解 其 他 加 工 。 
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2) 数据 词典 管理 

词典 管理 主要 是 把 词典 条 目 按照 某 种 格式 组 织 后 存储 在 词典 中 ， 并 提供 排序 、 查 找 和 统计 
等 功能 。 如 果 数 据 流 条 目 包含 了 来 源 和 去 向 ， 文 件 条 目 包 含 了 读 文 件 和 写 文 件 ， 还 可 以 检查 数 
据 词 典 与 数据 流 图 的 一 致 性 。 


3. 加 工 逻 辑 的 描述 


加 工 逻 辑 也 称 为 “小 说 明 ”。 常 用 的 加 工 逻 辑 描述 方法 有 结构 化 语言 、 判 定 表 和 判定 树 
三 种 。 

1) 结构 化 语言 

结构 化 语言 (如 结构 化 英语 ) 是 一 种 介 于 自然 语言 和 形式 化 语言 之 间 的 半 形 式 化 语言 ， 是 
自然 语言 的 一 个 受 限 子 集 。 

结构 化 语言 没有 严格 的 语法 ， 它 的 结构 通常 可 分 为 内 层 和 外 层 。 外 层 有 严格 的 语法 ， 而 内 
层 的 语法 比较 灵活 ， 可 以 接近 于 自然 语言 的 描述 。 

(1) 外 层 。 用 来 描述 控制 结构 ， 采 用 顺序 、 选 择 和 重复 三 种 基本 结构 。 

@ 顺序 结构 。 一 组 祈 使 语句 、 选 择 语句 、 重 复 语句 的 顺序 排列 。 祈 使 语句 是 指 至 少 包 含 
一 个 动词 及 一 个 名 词 ， 指 出 要 执行 的 动作 及 接受 动作 的 对 象 。 

@ 选择 结构 。 一 般 用 IF-THEN-ELSE-ENDIF、CASE-OF-ENDCASE 等 关键 词 。 

@ 重复 结构 。 一 般 用 DO-WHILE-ENDDO、REPEAT-UNTIL 等 关键 词 。 

(2) 内 层 。 一 般 是 采用 祈 使 语句 的 自然 语言 短语 ， 使 用 数据 字典 中 的 名 词 和 有 限 的 自 定义 
词 ， 其 动词 含义 要 具体 ， 尽 量 不 用 形容 词 和 副词 来 修饰 。 还 可 使 用 一 些 简单 的 算法 运算 和 逻辑 
运算 符号 。 

2) 判定 表 

在 有 些 情况 下 ， 数 据 流 图 中 某 个 加 工 的 一 组 动作 依赖 于 多 个 逻辑 条 件 的 取 值 。 这 时 ， 用 自 
然 语 言 或 结构 化 语言 都 不 易于 清楚 地 描述 出 来 ， 而 用 判定 表 就 能 够 清楚 地 表示 复杂 的 条 件 组 合 
与 应 做 的 动作 之 间 的 对 应 关系 。 

判定 表 由 4 部 分 组 成 ， 用 双 线 分 割 成 4 个 区 域 ， 如 图 9-10 所 示 。 


条 件 定义 条 件 取 值 的 组 合 


动作 定义 在 各 种 取 值 的 组 合 下 应 执行 的 动作 


图 9-10 判定 表 结 构 


3) 判定 树 
判定 树 是 判定 表 的 变形 。 一 般 情况 下 ， 判 定 树 比 判定 表 更 直观 ， 而 且 易 于 理解 和 使 用 。 判 
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定 树 结构 如 图 9-11 所 示 。 


图 9-11 判定 树 结构 


9.2.4 面向 对 象 分 析 方 法 


向 对 象 分 析 方 法 (ObjectOriented Analysis，OOA) 的 基本 任务 是 运用 00 方法 ,对 问题 
域 进行 分 析 和 理解 ， 正 确认 识 其 中 的 事物 及 它们 之 间 的 关系 ， 找 出 描述 问题 域 和 系统 功能 所 需 
的 类 和 对 象 ， 定 义 它们 的 属性 和 责任 ， 以 及 它们 之 间 的 关联 ， 最 终 产 生 一 个 符合 用 户 需求 ， 并 
能 直接 反映 问题 域 和 系统 功能 的 OOA 模型 及 其 详细 说 明 。 


1. 面向 对 象 的 基本 概念 


1) 对 象 

在 面向 对 象 的 系统 中 ， 对 和 象 是 基本 的 运行 时 的 实体 ， 它 既 包 括 数据 (属性 )， 也 包括 作用 
于 数据 的 操作 〈 行 为 )。 所 以 一 个 对 象 把 属性 和 行为 封装 为 一 个 整体 。 封 装 是 一 种 信息 隐蔽 技 
术 , 它 的 目的 是 使 对 象 的 使 用 者 和 生产 者 分 离 ， 使 对 象 的 定义 和 实现 分 开 。 从 程序 设计 者 来 看 ， 
对 象 是 一 个 程序 模块 ， 从 用 户 来 看 ， 对 象 为 他 们 提供 了 所 希望 的 行为 。 在 对 象 内 的 操作 通常 叫 
做 方法 。 一 个 对 象 通 常 可 由 对 象 名 、 属 性 和 操作 三 部 分 组 成 。 

2) 消息 

对 象 之 间 进 行 通信 的 一 种 构造 叫做 消息 。 当 一 个 消息 发 送 给 某 个 对 象 时 ， 包 含 要 求 接收 对 
象 去 执行 某 些 活动 的 信息 。 接 收 到 信息 的 对 象 经 过 解释 ， 然 后 予以 响应 。 这 种 通信 机 制 叫 做 消 
息 传递 。 发 送 消 息 的 对 象 不 需要 知道 接收 消息 的 对 象 如 何 对 请 求 予 以 响应 。 

3) 类 

一 个 类 定义 了 一 组 大 体 上 相似 的 对 象 。 一 个 类 所 包含 的 方法 和 数据 描述 一 组 对 象 的 共同 行 
为 和 属性 。 把 一 组 对 象 的 共同 特征 加 以 抽象 并 存 贮 在 一 个 类 中 的 能 力 ， 是 面向 对 象 技术 最 重要 
的 一 点 ; 是 否 建立 了 一 个 丰富 的 类 库 , 是 衡量 一 个 面向 对 象 程序 设计 语言 成 熟 与 否 的 重要 标志 。 

类 是 在 对 象 之 上 的 抽象 ， 对 和 象 是 类 的 具体 化 ， 是 类 的 实例 (Instance)。 在 分 析 和 设计 时 ， 
我 们 通常 把 注意 力 集中 在 类 上 ， 而 不 是 具体 的 对 象 。 我 们 也 不 必 为 每 个 对 象 逐个 定义 ， 只 需 对 
类 做 出 定义 ， 而 对 类 的 属性 的 不 同 赋值 即 可 得 到 该 类 的 对 象 实例 。 
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通常 把 一 个 类 和 这 个 类 的 所 有 对 象 称 为 “类 及 对 象 ”或 对 象 类 。 

4) 继承 

继承 是 父 类 和 子 类 之 间 共 享 数据 和 方法 的 机 制 。 这 是 类 之 间 的 一 种 关系 ， 在 定义 和 实现 一 
个 类 的 时 候 ， 可 以 在 一 个 已 经 存在 的 类 的 基础 上 来 进行 ， 把 这 个 已 经 存在 的 类 所 定义 的 内 容 作 
为 自己 的 内 容 ， 并 加 入 若干 新 的 内 容 。 

一 个 父 类 可 以 有 多 个 子 类 ， 这 些 子 类 都 是 父 类 的 特例 ， 父 类 描述 了 这 些 子 类 的 公共 属性 和 
操作 。 一 个 子 类 可 以 继承 它 的 父 类 《或 祖先 类 ) 中 的 属性 和 操作 ， 这 些 属性 和 操作 在 子 类 中 不 
必定 义 ， 子 类 中 还 可 以 定义 自己 的 属性 和 操作 。 

如 果 只 从 一 个 父 类 A 得 到 继承 ， 叫 做 单 重 继承 。 如 果 一 个 子 类 有 两 个 或 更 多 个 父 类 ， 则 称 
为 多 重 继承 。 

5) 多 态 

在 收 到 消息 时 ， 对 象 要 予以 响应 。 不 同 的 对 象 收 到 同一 消息 可 以 产生 完全 不 同 的 结果 ， 这 
一 现象 叫做 多 态 (Polymorphism)。 在 使 用 多 态 的 时 候 ， 用 户 可 以 发 送 一 个 通用 的 消息 ,而 实现 
的 细节 则 有 接收 对 象 自行 决定 。 这 样 ， 同 一 消息 就 可 以 调用 不 同 的 方法 。 

多 态 的 实现 受到 继承 的 支持 ， 利 用 类 的 继承 的 层次 关系 ， 把 具有 通用 功能 的 消息 存放 在 高 
层次 ， 而 不 同 的 实现 这 一 功能 的 行为 放 在 较 低层 次 ， 在 这 些 低层 
次 上 生成 的 对 象 能 够 给 通用 消息 以 不 同 的 响应 。 an 二 十 

多 态 有 几 种 不 同 的 形式 ，Cardelli 和 Wegner 把 它 分 为 4 类， | 包含 多 态 
如 图 9-12 所 示 。 其 中 ， 参 数 多 态 和 包含 多 态 称 为 通用 的 多 态 , 过 过 载 多 太 
载 多 态 和 强制 多 态 称 为 特定 的 多 态 。 Wes 

参数 多 态 是 应 用 比较 广泛 的 多 态 ， 被 称 为 最 纯 的 多 态 。 包 pe 
含 多 态 在 许多 语言 中 都 存在 ， 最 常见 的 例子 就 是 子 类 型 化 ， 即 
一 个 类 型 是 另 一 个 类 型 的 子 类 型 。 过 载 (Overloading) 多 态 是 同一 个 变量 被 用 来 表示 不 同 的 功 
能 而 通过 上 下 文 以 决定 一 个 名 所 代表 的 功能 。 

6) 动态 绑 定 (Dynamic Binding) 

绑 定 是 一 个 把 过 程 调用 和 响应 调用 所 需要 执行 的 代码 加 以 结合 的 过 程 。 在 一 般 的 程序 设计 
语言 中 ， 绑 定 是 在 编译 时 进行 的 ， 叫 做 静态 绑 定 。 动 态 绑 定 则 是 在 运行 时 进行 的 ， 因 此 ， 一 个 
给 定 的 过 程 调用 和 代码 的 结合 是 直到 调用 发 生 时 才 进行 的 。 

动态 绑 定 是 和 类 的 继承 以 及 多 态 相 联系 的 。 在 继承 关系 中 ， 子 类 是 父 类 的 一 个 特例 ， 所 以 
父 类 对 象 可 以 出 现 的 地 方 ， 子 类 对 象 也 可 以 出 现 。 因 此 在 运行 过 程 中 ， 当 一 个 对 象 发 送 消息 请 
求 服务 时 ， 要 根据 接收 对 象 的 具体 情况 将 请 求 的 操作 与 实现 的 方法 进行 连接 ， 即 动态 绑 定 。 
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2. 统一 建 模 语言 UML) 概述 
统一 建 模 语言 (Unified Modeling Language，UML) 是 面向 对 象 软件 的 标准 化 建 模 语言 。 


事实 上 的 工业 标准 。 


础 装配 系统 。 
1) UML 的 结构 


UML 由 三 个 要 素 构成 :构造 块 、 规 则 和 公共 机 制 。 


于 其 简单 、 统 一 ， 又 能 够 表达 软件 设计 中 的 动态 和 静态 信息 ， 目 前 已 经 成 为 可 视 化 建 模 语言 


从 企业 信息 系统 到 基于 Web 的 分 布 式 应 用 ,甚至 严格 的 实时 嵌入 式 系统 都 适合 用 UML 来 
建 模 。 因 为 UML 是 一 种 富有 表达 力 的 语言 ， 可 以 描述 开发 所 需要 的 各 种 视图 ， 然 后 以 此 为 基 


(1) 构造 块 。UML 有 3 种 构造 块 : 事物 、 关 系 和 图 。 事 物 是 对 模型 中 最 具有 代表 性 的 成 
分 的 抽象 ， 关系 把 事物 结合 在 一 起 ;图 聚集 了 相关 的 事物 。 
(2) 规则 。 规 则 是 支配 构造 块 如 何 放置 在 一 起 的 规定 ， 包 括 给 构造 块 命名 ; 给 一 个 名 字 以 


特定 含义 的 语 境 ， 即 范围 ， 怎样 使 


或 看 见 名 字 ， 即 可 见 性 ; 事物 如 何 正 确 、 一 致 地 相互 联系 ， 


即 完整 性 ， 运 行 或 模拟 动态 模型 的 含义 是 什么 ， 即 执行 。 

(3) 公共 机 制 。 公 共 机 制 是 指 达到 特定 目标 的 公共 UML 方法 ， 主 要 包括 规格 说 明 〈 详 细 
说 明 )、 修 饰 、 公 共 分 类 〈 通 用 划分 》 和 扩展 机 制 4 种 。 规 格 说 明 是 事物 语义 的 细节 描述 ， 它 
是 模型 真正 的 核心 ，UML 为 每 个 事物 设置 了 一 个 简单 的 记号 ， 可 以 通过 修饰 来 表达 更 多 的 信 
息 ; UML 包括 两 组 公共 分 类 : 类 与 对 象 、 接 口 与 实现 ; 扩展 机 制 包 括 约 束 、 构 造型 和 标记 值 。 

UML 对 系统 架构 的 定义 式 系统 的 组 织 结构 ， 包 括 系统 分 解 的 组 成 部 分 ， 以 及 它们 的 关联 
性 、 交 互 机 制 和 指导 原则 等 提供 系统 设计 的 信息 。 具 体 来 说 ， 有 以 下 5 种 系统 视图 。 

(1) 逻辑 视图 。 逻辑 视图 也 称 为 设计 视图 ， 它 表示 了 设计 模型 中 在 架构 方面 具有 重要 意义 


的 部 分 ， 即 类 、 子 系统 、 包 和 用 例 


实现 的 子 集 。 


(2) 进程 视图 。 进 程 视图 是 可 执行 线程 和 进程 作为 活动 类 的 建 模 ， 它 是 逻辑 视图 的 一 次 执 


行 实例 ， 描 述 了 并 发 与 同步 结构 。 


(3) 实现 视图 。 实 现 视图 对 组 成 基于 系统 的 物理 代码 的 文件 和 构件 进行 建 模 。 
(4) 部 署 视 图 。 部 署 视 图 把 构件 部 署 到 一 组 物理 节点 上 ， 用 来 表示 软件 到 硬件 的 映射 和 分 


布 结构 。 


(5) 用 例 视图 。 用 例 视图 是 用 来 描述 最 基本 的 需求 分 析 模 型 。 


2) 事物 


UML 中 有 4 种 事物 : 结构 事物 、 行 为 事物 、 分 组 事物 和 注释 事物 。 
(1) 结构 事物 (Structural Thing)。 
结构 事物 是 UML 模型 中 的 名 词 。 它们 通常 是 模型 的 静态 部 分 , 描述 概念 或 物理 元 素 。 UML 


有 7 种 结构 事物 : 类 (Class)、 接 口 (Interface)、 协 作 (Collaboration)、 用 例 (Use Case)、 主 


t 
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动 类 (Active Class)、 构 件 (Component) 和 节点 (Node)。 结 构 事 物 的 图 形 表示 如 图 9-13 所 示 。 
类 是 描述 具有 相同 属性 、 方 法 、 关 系 和 语义 对 象 的 集合 ， 一 个 类 实现 一 个 或 多 个 接口 。 接 
是 指 类 或 构件 提供 特定 服务 的 一 组 操作 的 集合 ， 接 口 描述 了 类 或 构件 的 对 外 可 见 的 动作 。 协 
作 定义 了 交互 的 操作 ， 使 一 些 角色 和 其 他 事物 一 起 工作 ， 提 供 一 些 合作 的 动作 。 用 例 是 描述 
系列 的 动作 ， 产 生 有 价值 的 结果 。 在 模型 中 用 例 通 常用 来 组 织 行为 事物 。 用 例 是 通过 协作 来 实 
现 的 。 主 动 类 的 对 象 有 一 个 或 多 个 进程 或 线程 。 构 件 是 物理 上 或 可 替换 的 部 分 ， 它 实现 了 一 个 
接口 的 集合 。 节 点 是 一 个 元 素 ， 它 在 运行 时 存在 ， 代 表 一 个 可 计算 的 资源 ， 通 常 占 用 一 些 内 存 
和 具有 处 理 能 力 。 一 个 构件 集合 一 般 来 说 位 于 一 个 节点 , 但 有 可 能 从 一 个 节点 转 到 另 一 个 节点 。 


ee 
属性 (协作 名 》 用 例 名 
接口 名 en 


类 接口 协作 用 例 


9-13 ”结构 事物 的 图 形 表示 


(2) 行为 事物 (Behavior Thing)。 

行为 事物 是 UML 模型 的 动态 部 分 。 它 们 是 模型 中 的 动词 ， 描 述 了 跨越 时 间 和 空间 的 行为 。 
共有 两 类 主要 的 行为 事物 : 交互 〈Interaction) 和 状态 机 〈State Machine)。 

交互 由 在 特定 语 境 中 共同 完成 一 定 任务 的 一 组 对 象 之 间 交 换 的 消息 组 成 。 一 个 对 象 群体 的 
行为 或 单个 操作 的 行为 可 以 用 一 个 交互 来 描述 。 交 互 涉及 一 些 其 他 元 素 ， 包 括 消息 、 动 作 序列 
(由 一 个 消息 所 引起 的 行为 ) 和 链 〈 对 象 间 的 连接 )。 在 图 形 上 ， 把 一 个 消息 表示 为 一 条 有 向 直 
线 ， 通 常 在 表示 消息 的 线段 上 标注 操作 名 ， 如 图 9-14 〈a) 所 示 。 
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(a) 消息 (b) 状态 


图 9-14 消息 与 状态 表示 
状态 机 描述 了 一 个 对 象 或 一 个 交互 在 生命 期 内 响应 事件 所 经 历 的 状态 序列 。 单 个 类 或 一 组 
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类 之 间 协作 的 行为 可 以 用 状态 机 来 描述 。 一 个 状态 机 涉及 到 一 些 其 他 元 素 , 包括 状态 、 转换 (从 
一 个 状态 到 另 一 个 状态 的 流 )、 事 件 〔 触 发 转换 的 事物 ) 和 活动 对 一 个 转换 的 响应 )。 在 图 形 
上 , 把 状态 表示 为 一 个 圆 角 矩形 , 通常 在 圆 角 矩形 中 含有 状态 的 名 称 及 其 子 状 态 , 如 图 9-14 (b) 
所 示 。 

(3) 分 组 事物 (Grouping Thing)。 

分 组 事物 是 UML 模型 的 组 织 部 分 。 它 们 是 一 些 由 模型 分 解 成 的 “盒子 "。 在 所 有 的 分 组 
物 中 ， 最 主要 的 分 组 事物 是 包 (Package)。 包 是 把 元 素 组 织 成 组 的 机 制 ， 这 种 机 制 具 有 多 种 
图 。 结 构 事 物 、 行 为 事物 甚至 其 他 分 组 事物 都 可 以 放 进 包 内 。 包 与 构件 ( 仅 [一 ] 

在 运行 时 存在 ) 不 同 ， 它 纯粹 是 概念 上 的 《〈 即 它 仅 在 开发 时 存在 )。 包 的 图 
形 化 表示 如 图 9-15 所 示 。 
(4) 注释 事物 (Annotational Thing)。 

注释 事物 是 UML 模型 的 解释 部 分 。 这 些 注释 事物 用 来 描述 、 说 明和 标 
注 模型 的 任何 元 素 。 注解 (Note) 是 一 种 主要 的 注释 事物 。 注 解 是 一 个 依附 
于 一 个 元 素 或 者 一 组 元 素 之 上 ,对 它 进行 约束 或 解释 的 简单 符号 。 注解 的 图 
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卉 


图 9-15 包 


形 化 表示 如 图 9-16 所 示 。 9-16 注解 
3) 关系 
UML 中 有 四 种 关系 : 依赖 、 关 联 、 泛 化 和 实现 。 关 系 的 图 形 表示 如 图 9-17 所 示 。 
ET 2 0..1 0..* oO 
(a) 依赖 employer employee (Cc) 聚集 
> (中 关联 > 
(d) 泛 化 (e) 实现 


图 9-17 关系 的 图 形 表示 


(1) 依赖 (Dependency)。 

依赖 是 两 个 事物 间 的 语义 关系 , 其 中 一 个 事物 (独立 事物 ) 发 生变 化 会 影响 另 一 个 事物 ( 依 
赖 事物 ) 的 语义 。 在 图 形 上 ， 把 一 个 依赖 画 成 一 条 可 能 有 方向 的 虚线 ， 如 图 9-17 (a) 所 示 。 

(2) 关联 (Association ) 。 

关联 是 一 种 结构 关系 ， 它 描述 了 一 组 链 ， 链 是 对 象 之 间 的 连接 ， 如 图 9-17 (b) 所 示 。 聚 集 
(Aggregation) 是 一 种 特殊 类 型 的 关联 ， 它 描述 了 整体 和 部 分 间 的 结构 关系 ， 如 图 9-17 (c) 所 
示 。 需 要 说 明 的 是 ， 在 关联 上 可 以 标注 重复 度 (Multiplicity) 和 角色 (Role)。 

(3) 泛 化 (generalization)。 

泛 化 是 一 种 特殊 /一 般 关 系 , 特殊 元 素 ( 子 元 素 ) 的 对 象 可 替代 一 般 元 素 ( 父 元 素 ) 的 对 象 。 
用 这 种 方法 ， 子 元 素 共享 了 父 元 素 的 结构 和 行为 。 在 图 形 上 ， 把 一 个 泛 化 关系 画 成 一 条 带 有 空 
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心 箭头 的 实 线 ， 它 指向 父 元 素 ， 如 图 9-17 (d) 所 示 。 

(4) 实现 (Realization ) 。 

实现 是 类 元 之 间 的 语义 关系 ， 其 中 一 个 类 元 指定 了 由 另 一 个 类 元 保证 执行 的 契约 。 在 两 种 
地 方 要 遇 到 实现 关系 : 一 种 是 在 接口 和 实现 它们 的 类 或 构件 之 间 ; 另 一 种 是 在 用 例 和 实现 它们 
的 协作 之 间 。 在 图 形 上 ， 把 一 个 实现 关系 画 成 一 条 带 有 空心 箭头 的 虚线 ， 如 图 9-17 (e) 所 示 。 

这 四 种 关系 是 UML 模型 中 可 以 包含 的 基本 关系 事物 。 它 们 也 有 变 体 ， 例 如 ， 依 赖 的 变 体 
有 精 化 、 跟 踪 、 包 含 和 延伸 。 


3. UML 中 的 图 


图 (Diagram) 是 一 组 元 素 的 图 形 表示 ， 大 多 数 情 况 下 把 图 画 成 项 点 (代表 事物 ) 和 弧 〈 代 
表 关 系 ) 的 连通 图 。 为 了 对 系统 进行 可 视 化 ,可 以 从 不 同 的 角度 画图 ， 这 样 图 是 对 系统 的 投影 。 

UML2.0 提供 了 13 种 图 ， 它 们 分 别 是 : 类 图 、 对 象 图 、 用 例 图 、 序 列 图 、 通 信 图 、 状 态 图 、 
活动 图 、 构 件 图 、 部 署 图 、 组 合 结构 图 、 包 图 、 交 互 概览 图 和 时 序 图 。 

1) 类 图 

类 图 (Class Diagram) 展现 了 一 组 对 象 、 接 口 、 协 作 和 它们 之 间 的 关系 。 在 面向 对 象 系统 
的 建 模 中 所 建立 的 最 常见 的 图 就 是 类 图 。 类 图 给 出 系统 的 静态 设计 视图 。 包 含 主动 类 的 类 图 给 
出 了 系统 的 静态 进程 视图 。 

类 图 中 通常 包括 下 述 内容 : 类 ; 接口 ， 协作; 依赖 、 泛 化 和 关联 关系 ， 如 图 9-18 所 示 。 


类 图 中 也 可 以 包含 注解 和 约束 。 类 图 还 可 以 含有 包 或 子 系统 ， 二 者 都 用 于 把 模型 元 素 聚集 
成 更 大 的 组 块 。 
类 图 用 于 对 系统 的 静态 设计 视图 建 模 。 这 种 视图 主要 支持 系统 的 功能 需求 ， 即 系统 要 提供 


给 最 终 用 户 的 服务 。 当 对 系统 的 静态 设计 视图 建 模 时 ， 通 常 以 下 述 三 种 方式 之 一 使 用 类 图 。 

(1) 对 系统 的 词汇 建 模 。 

对 系统 的 词汇 建 模 涉及 做 出 这 样 的 决定 : 哪些 抽象 是 考虑 中 的 系统 的 一 部 分 ， 哪 些 抽象 处 
于 系统 边界 之 外 。 用 类 图 详细 描述 这 些 抽象 和 它们 的 职责 。 

(2) 对 简单 的 协作 建 模 。 

协作 是 一 些 共同 工作 的 类 、 接 口 和 其 他 元 素 的 群体 ， 该 群体 提供 的 一 些 合作 行为 强 于 所 有 
这 些 元 素 的 行为 之 和 。 例 如 当 对 分 布 式 系统 的 事务 语义 建 模 时 ， 不 能 仅仅 盯 着 一 个 单独 的 类 来 
推断 要 发 生 什 么 ， 而 要 有 相互 协作 的 一 组 类 来 实现 这 些 语义 。 用 类 图 对 这 组 类 以 及 它们 之 间 的 
关系 进行 可 视 化 和 详 述 。 

(3) 对 逻辑 数据 库 模 式 建 模 。 

将 模式 看 作为 数据 库 的 概念 设计 的 蓝图 。 在 很 多 领域 中 ， 要 在 关系 数据 库 或 面向 对 象 数据 
库 中 存储 永久 信息 。 可 以 用 类 图 对 这 些 数据 库 的 模式 建 模 。 
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2) 对 象 图 

对 象 图 (Object Diagram) 展现 了 一 组 对 象 以 及 它们 之 间 的 关系 。 对 象 图 描述 了 在 类 图 中 所 
建立 的 事物 的 实例 的 静态 快照 。 

对 象 图 一 般 包括 对 象 和 链 。 


1 


Department 


address:String 
voice:Number 


角色 
member 出 manager 
属性 name:Name 
- emploueelD:Integer 
操作 getPersonalRecords() 


getPhoto(P:Photo) texlD:Integer 
salary:Rral 


图 9-18 UML 类 图 


和 类 图 一 样 ， 对 象 图 给 出 系统 的 静态 设计 视图 或 静态 进程 视图 ， 但 它们 是 从 真实 的 或 原型 
案例 的 角度 建立 的 。 这 种 视图 主要 支持 系统 的 功能 需求 ， 即 系统 应 该 提供 给 最 终 用 户 的 服务 。 
利用 对 象 图 可 以 对 静态 数据 结构 建 模 。 

当 对 系统 的 静态 设计 视图 或 静态 进程 视图 建 模 时 ， 主 要 是 使 用 对 象 图 对 对 象 结构 进行 建 
模 。 对 对 象 结构 建 模 涉及 到 在 给 定时 刻 抓 取 系统 中 的 对 象 的 快照 。 对 象 图 表示 了 交互 图 表示 的 
动态 场景 的 一 个 静态 画面 。 可 以 使 用 对 象 图 可 视 化 、 详 述 、 构 造 和 文档 化 系统 中 存在 的 实例 以 
及 它们 之 间 的 相互 关系 。 

3) 用 例 图 
用 例 是 一 种 描述 系统 需求 的 方法 。 用 例 图 (Use Case Diagram) 展现 了 一 组 用 例 、 参 与 者 
(Actor) 以 及 它们 之 间 的 关系 。 
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用 例 图 中 通常 包含 三 种 元 素 : 用 例 、 参 与 者 、 用 例 之 间 的 关系 ， 如 图 9-19 所 示 。 
参与 者 是 指 存 在 系统 外 部 并 与 系统 进行 交互 的 任何 事物 ， 既 可 以 是 使 用 系统 的 用 户 ， 也 可 


以 是 其 他 外 部 系统 和 设备 等 外 部 实体 。 
Place Phone call Place Conference 
call 
人 network 
Reccive Phonc call 
参与 


(extends) 


《extends》 


用 例 


User 


图 9-19 UML 用 例 图 


用 例 是 描述 系统 的 一 项 功能 的 一 组 动作 序列 ， 这 样 的 动作 序列 表示 参与 者 与 系统 间 的 
交互 。 
用 例 之 间 通 常 存在 三 种 关系 : 包含 (Include)、 扩 展 〈Extend) 和 泛 化 〈Generalization ) 。 

(1) 包含 关系 。 当 可 以 从 两 个 或 两 个 以 上 的 用 例 中 提取 公共 行为 时 ， 应 该 使 用 包含 关系 来 
表示 它们 。 其 中 被 提取 出 来 的 公共 用 例 称 为 抽象 用 例 , 而 把 原始 用 例 称 为 基本 用 例 或 基础 用 例 。 
当 多 个 用 例 需 要 使 用 同一 段 事 件 流 时 ， 抽 象 称 为 公共 用 例 ， 可 以 避免 在 多 个 用 例 中 重复 地 描述 
这 段 事 件 流 ， 也 可 以 防止 这 段 事 件 流 在 不 同 用 例 中 的 描述 出 现 不 一 致 。 但 需要 修改 这 段 公共 的 
需求 时 ， 也 只 要 修改 一 个 用 例 ， 避 免 同时 修改 多 个 用 例 而 产生 的 不 一 致 和 重复 性 工作 。 另 外 ， 
当 某 个 用 例 的 事件 流 过 于 复杂 时 ， 为 了 简化 用 例 的 描述 ， 也 可 以 将 某 一 段 事 件 流 抽象 成 为 一 个 
被 包含 的 用 例 。 

(2) 扩展 关系 。 如 果 一 个 用 例 明显 地 混合 了 两 种 或 两 种 以 上 的 场景 ， 即 根据 情况 可 能 发 生 
多 种 分 支 ， 则 可 以 将 这 个 用 例 分 为 一 个 基本 用 例 和 一 个 或 多 个 扩展 用 例 。 

(3) 泛 化 关系 。 当 多 个 用 例 共同 拥有 一 种 类 似 的 结构 和 行为 时 ， 可 以 将 它们 的 共性 抽象 成 
为 父 用例 ， 其 他 的 用 例 作为 泛 化 关系 中 的 子 用 例 。 在 用 例 的 泛 化 关系 中 ， 子 用 例 是 父 用 例 的 一 
种 特殊 形式 ， 子 用 例 继承 了 父 用 例 所 有 的 结构 、 行 为 和 关系 。 
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用 例 图 用 于 对 系统 的 静态 用 例 视 图 进行 建 模 。 这 个 视图 主要 支持 系统 的 行为 ， 即 该 系统 在 
它 的 周边 环境 的 语 境 中 所 提供 的 外 部 可 见 服务 。 
当 对 系统 的 静态 用 例 视图 建 模 时 ， 可 以 用 下 列 两 种 方式 来 使 用 用 例 图 。 
(1) 对 系统 的 语 境 建 模 
对 一 个 系统 的 语 境 进行 建 模 ， 包 括 围绕 整个 系统 画 一 条 线 ， 并 声明 有 哪些 参与 者 位 于 系统 
之 外 并 与 系统 进行 交互 。 在 这 里 ， 用 例 图 说 明了 参与 者 以 及 他 们 所 扮演 的 角色 的 含义 。 
(2) 对 系统 的 需求 建 模 
对 一 个 系统 的 需求 进行 建 模 ， 包 括 说 明 这 个 系统 应 该 做 什么 〈 从 系统 外 部 的 一 个 视点 出 
发 )， 而 不 考虑 系统 应 该 怎样 做 。 在 这 里 ， 用 例 图 说 明了 系统 想 要 的 行为 。 通 过 这 种 方式 ， 用 
例 图 使 我 们 能 够 把 整个 系统 看 作 一 个 黑 盒子 。 你 可 以 观察 到 系统 外 部 有 什么 ， 系 统 怎样 与 哪些 
外 部 事物 相互 作用 ， 但 却 看 不 到 系统 内 部 是 如 何 工作 的 。 
4) 交互 图 
序列 图 、 通 信 图 、 交 互 概览 图 和 时 序 图 均 被 称 为 交互 图 ， 它 们 用 于 对 系统 的 动态 方面 进行 
建 模 。 一 张 交互 图 显示 的 是 一 个 交互 ， 由 一 组 对 象 和 它们 之 间 的 关系 组 成 。 包 含 它们 之 间 可 能 
传递 的 消息 。 顺 序 图 是 强调 消息 时 间 顺 序 的 交互 图 ， 通 信 图 则 是 强调 接收 和 发 送 消息 的 对 象 的 
结构 组 织 的 交互 图 。 
交互 图 用 于 对 一 个 系统 的 动态 方面 建 模 。 在 多 数 情况 下 ， 它 包括 对 类 、 接 口 、 构 件 和 节点 
的 具体 的 或 原型 化 的 实例 以 及 它们 之 间 传 递 的 消息 进行 建 模 ， 所 有 这 些 都 位 于 一 个 表达 行为 的 
脚本 的 语 境 中 。 交 互 图 可 以 单独 使 用 ， 来 可 视 化 、 详 述 、 构 造 和 文档 化 一 个 特定 的 对 象 群体 的 
动态 方面 ， 也 可 以 用 来 对 一 个 用 例 的 特定 的 控制 流 进行 建 模 。 
交互 图 一 般 包 含 对 象 、 链 和 消息 。 
(1) 序列 图 。 
序列 图 (Sequence Diagram) 是 场景 (Scenario) 的 图 形 化 表示 ， 描 述 了 以 时 间 顺 序 组 织 的 
对 象 之 间 的 交互 活动 。 如 图 9-20 所 示 ， 形 成 序列 图 时 ， 首 先 把 参加 交互 的 对 象 放 在 图 的 上 方 ， 
沿 x 轴 方 向 排列 。 通 常 把 发 起 交互 的 对 象 放 在 左边 ， 较 下 级 对 象 依次 放 在 右边 。 然 后 ， 把 这 些 
对 和 象 发 送 和 接收 的 消息 沿 Y 轴 方 向 按时 间 顺 序 从 上 到 下 放置 。 这 样 ， 就 向 提供 了 控制 流 随 时 间 
推移 的 清晰 的 可 视 化 轨迹 。 
序列 图 有 两 个 不 同 于 通信 图 的 特征 : 
序列 图 有 对 象 生 命 线 。 对 象 生命 线 是 一 条 垂直 的 虚线 ， 表 示 一 个 对 象 在 一 段 时 间 内 存在 。 
在 交互 图 中 出 现 的 大 多 数 对 象 存在 于 整个 交互 过 程 中 ， 所 以 、 这 些 对 象 全 都 排列 在 图 的 顶部 ， 
其 生命 线 从 图 的 顶部 画 到 图 的 底部 。 但 对 象 也 可 以 在 交互 过 程 中 创建 ， 它 们 的 生命 线 从 接收 到 
构造 型 为 create 的 消息 时 开始 。 对 象 也 可 以 在 交互 过 程 中 撤销 ， 它 们 的 生命 线 在 接收 到 构造 型 
为 destroy 的 消息 时 结束 〈 并 且 给 出 一 个 大 X 的 标记 表明 生命 的 结束 )。 


TH 
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序列 图 有 控制 焦点 。 控 制 焦点 是 一 个 瘦 高 的 矩形 ， 表 示 一 个 对 象 执行 一 个 动作 所 经 历 的 时 
间 段 ， 既 可 以 是 直接 执行 ， 也 可 以 是 通过 下 级 过 程 执行 。 算 形 的 项 部 表示 动作 的 开始 ， 底 部 表 
示 动 作 的 结束 (可 以 由 一 个 返回 消息 来 标记 )。 还 可 以 通过 将 另 一 个 控制 焦点 放 在 它 的 父 控制 
焦点 的 右边 来 显示 由 循环 、 自 身 操作 调用 或 从 另 一 个 对 象 的 回调 所 引起 的 ) 控制 焦点 的 工 套 
〈 其 嵌 套 深度 可 以 任意 )。 如 果 想 特别 精确 地 表示 控制 焦点 在 哪里 ， 也 可 以 在 对 象 的 方法 被 实际 
执行 〈 并 且 控 制 还 没 传 给 另 一 个 对 象 ) 期 间 ， 将 那 段 矩形 区 域 阴 影 化 。 


ciClient D:ODBCProxy 


| (create》 


消息 对 象 


setValues(3,4) 


commited 


对 象 生 合 线 < 一 一 


| 对 象 销毁 
1 


setValues(d,“CO™) 


图 9-20 UML 序列 图 


(2) 通信 图 。 

通信 图 (Communication Diagram) 强调 收发 消息 的 对 象 的 结构 组 织 ， 在 早期 的 版 本 中 也 被 称 
作协 作 图 。 通 信 图 强调 参加 交互 的 对 象 的 组 织 。 产 生 一 张 通信 图 ， 首 先 要 将 参加 交互 的 对 象 作为 
图 的 顶点 。 然 后 ， 把 连接 这 些 对 象 的 链表 示 为 图 的 弧 。 最 后 ， 用 对 象 发 送 和 接收 的 消息 来 修饰 这 
些 链 。 这 就 提供 了 在 协作 对 象 的 结构 组 织 的 语 境 中 观察 控制 流 的 一 个 清晰 的 可 视 化 轨迹 。 

通信 图 有 以 下 两 个 不 同 于 序列 图 的 特性 。 

通信 图 有 路 径 。 为 了 指出 一 个 对 象 如 何 与 另 一 个 对 象 链接 ， 你 可 以 在 链 的 末端 附 上 一 个 路 
径 构造 型 如 构造 型 local， 表 示 指 定 对 象 对 发 送 者 而 言 是 局 部 的 )。 通 常 只 需要 显 式 地 表示 以 
下 几 种 链 的 路 径 : local (局 部 )、parameter (参数 )、global (全 局 )， 以 及 self (自身 )， 但 不 必 
表示 association (关联 )。 

通信 图 有 顺序 号 。 为 表示 一 个 消息 的 时 间 顺 序 ， 可 以 给 消息 加 一 个 数字 前 级 (从 1 号 消息 
开始 )， 在 控制 流 中 ， 每 个 新 消息 的 顺序 号 单调 增加 (如 2、3 等 )。 为 了 显示 髓 套 ， 可 使 用 带 
小 数 点 的 号 码 (1 表示 第 一 个 消息 ，1.1 表示 嵌 套 在 消息 1 中 的 第 一 个 消息 ，1.2 表示 嵌 套 在 消 
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息 1 中 的 第 二 个 消息 ; 等 等 )。 媒 套 可 为 任意 深度 。 还 要 注意 的 是 ， 沿 同一 个 链 ， 可 以 显示 许多 
消息 〈 可 能 发 自 不 同 的 方向 )， 并 且 每 个 消息 都 有 唯一 的 一 个 顺序 号 。 
序列 图 和 通信 图 是 同 构 的 ， 它 们 之 间 可 以 相互 转换 。 

交互 概览 图 是 UML2.0 新 增 的 交互 图 之 一 ， 它 描述 交互 (特别 是 关注 控制 流 )， 但 是 抽象 
掉 了 消息 和 生命 线 。 它 使 用 活动 图 的 表示 法 。 纯粹 的 交互 概览 图 中 所 有 的 活动 都 是 交互 发 生 的 。 
另 一 种 新 增 的 、 特 别 适合 实时 和 嵌入 式 系统 建 模 的 交互 图 称 为 时 序 图 ， 时 序 图 关注 沿 着 线性 时 
间 轴 、 生命 线 内 部 和 生命 线 之 间 的 条 件 改变 。 它 描述 对 象 状态 随 着 时 间 改 变 的 情况 , 很 像 示 波 器 ， 
适合 分 析 周 期 和 非 周期 性 任务 。 

5) 状态 图 

状态 图 (Statechart Diagram) 展现 了 一 个 状态 机 ， 它 由 状态 、 转 换 、 事 件 和 活动 组 成 。 状 
态 图 关注 系统 的 动态 视图 ， 它 对 于 接口 、 类 和 协作 的 行为 建 模 尤 为 重要 ， 它 强调 对 象 行为 的 事 
件 顺序 。 状 态 图 通常 包括 : 简单 状态 和 组 合 状态 、 转 换 〈 事 件 和 动作 )。 如 图 9-21 所 示 。 


组 全 状态 


谋 套 状态 


Connected 


Processing 


Transmiting 
Cleaning Up es 


转换 
图 9-21 UML 状态 图 


可 以 用 状态 图 对 系统 的 动态 方面 建 模 。 这 些 动 态 方面 可 以 包括 出 现在 系统 体系 结构 的 任何 视 
图 中 的 任何 一 种 对 象 的 按 事件 排序 的 行为 ， 这 些 对 象 包括 类 〈 各 主动 类 )、 接 口 、 构 件 和 节点 。 

当 对 系统 、 类 或 用 例 的 动态 方面 建 模 时 ， 通 常 是 对 反应 型 对 象 建 模 。 

一 个 反应 型 或 事件 驱动 的 对 象 是 这 样 一 个 对 象 ， 其 行为 通常 是 由 对 来 自 语 境外 部 的 事件 做 
出 反应 来 刻画 的 。 反 应 型 对 象 在 接收 到 一 个 事件 之 前 通常 处 于 空闲 状态 。 当 它 接收 到 一 个 事件 
时 ， 它 的 反应 常常 依赖 于 以 前 的 事件 。 在 这 个 对 象 对 事件 做 出 反应 后 ， 它 就 又 变 成 闲 状态 ， 等 
待 下 一 个 事件 。 对 于 这 种 对 象 ， 将 着 眼 于 对 象 的 稳定 状态 、 能 够 触发 从 状态 到 状态 的 转换 的 事 
件 ， 以 及 当 每 个 状态 改变 时 所 发 生 的 动作 。 

6) 活动 图 
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活动 图 (Activity Diagram) 是 一 种 特殊 的 状态 图 ， 它 展现 了 在 系统 内 从 一 个 活动 到 另 一 个 
活动 的 流程 。 活 动 图 专注 于 系统 的 动态 视图 。 它 对 于 系统 的 功能 建 模特 别 重要 ， 并 强调 对 象 间 
的 控制 流程 。 

活动 图 一 般 包 括 : 活动 状态 和 动作 状态 、 转 换 和 对 象 。 

用 活动 图 建 模 的 控制 流 中 ， 会 发 生 一 些 事情 。 你 可 能 要 对 一 个 设置 属性 值 或 返回 一 些 值 的 
表达 式 求 值 。 你 也 可 能 要 调用 对 象 上 的 操作 ， 发 送 一 个 消息 给 对 象 ， 甚 至 创建 或 销毁 对 象 ， 这 
些 可 执行 的 原子 计算 被 称 作 动作 状态 ， 因 为 它们 是 该 系统 的 状态 ， 每 个 原子 计算 都 代表 一 个 动 
作 的 执行 。 动 作 状 态 不 能 被 分 解 。 动 作 状态 是 原子 的 ， 也 就 是 说 事件 可 以 发 生 ， 但 动作 状态 的 
工作 不 能 被 中 断 。 最 后 ， 动 作 状态 的 工作 所 占用 的 执行 时 间 一 般 被 看 作 是 可 忽略 的 。 

活动 状态 能 够 进一步 被 分 解 ， 它 们 的 活动 由 其 他 的 活动 图 表示 。 活 动 状态 不 是 原子 的 ， 它 
们 可 以 被 中 断 。 并 且 ， 一 般 来 说 ， 还 要 考虑 到 它 需 要 花费 一 段 时 间 来 完成 。 可 以 把 一 个 动作 状 
态 看 作 一 个 活动 状态 的 特例 。 类 似 地 ， 可 以 把 一 个 活动 状态 看 作 一 个 组 合 ， 它 的 控制 流 由 其 他 
的 活动 状态 和 动作 状态 组 成 。 

活动 图 可 以 表示 分 支 和 汇合 。 

当 对 一 个 系统 的 动态 方面 建 模 时 ， 通 常 有 两 种 使 用 活动 图 的 方式 。 

(1) 对 工作 流 建 模 。 此 时 所 关注 的 是 与 系统 进行 协作 的 参与 者 所 观察 到 的 活动 。 工 作 流 常 
常 位 于 软件 系统 的 边缘 ， 用 于 可 视 化 、 详 述 、 构 造 和 文档 化 开发 系统 所 涉及 的 业务 过 程 。 在 活 
动 图 的 这 种 用 法 中 ， 对 对 象 流 的 建 模 是 特别 重要 的 。 

(2) 对 操作 建 模 。 此 时 是 把 活动 图 作为 流程 图 使 用 ， 对 一 个 计算 的 细节 部 分 建 模 。 在 活动 
图 的 这 种 用 法 中 ， 对 分 文 、 分 又 和 汇合 状态 的 建 模 是 特别 重要 的 。 用 于 这 种 方式 的 活动 图 语 境 
包括 该 操作 的 参数 和 它 的 局 部 对 象 。 

7) 构件 图 

构件 图 (Component Diagram) 展现 了 一 组 构件 之 间 的 组 织 和 依赖 。 构 件 图 专注 于 系统 的 静 
态 实现 视图 。 它 与 类 图 相关 ， 通 常 把 构件 映射 为 一 个 或 多 个 类 、 接 口 或 协作 。 

8) 部 署 图 

部 署 图 (Deployment Diagram) 展现 了 运行 处 理 节点 以 及 其 中 的 构件 的 配置 。 部 署 图 给 出 
了 体系 结构 的 静态 实施 视图 。 它 与 构件 图 相关 ， 通 常 一 个 节点 包含 一 个 或 多 个 构件 。 


4. 面向 对 象 分 析 
同 其 他 分 析 方 法 一 样 ， 面 向 对 象 分 析 (Object-Oriented Analysis，OOA) 的 目的 是 为 了 获得 
对 应 用 问题 的 理解 。 理 解 的 目的 是 确定 系统 的 功能 、 性 能 要 求 。 面 向 对 象 分 析 法 与 功能 /数据 分 


析 法 之 间 的 差别 是 前 期 的 表述 含义 不 同 。 功 能 /数据 分 析 法 分 开 考虑 系统 的 功能 要 求 和 数据 及 其 
结构 ， 面 向 对 象 分 析 方法 是 将 数据 和 功能 结合 在 一 起 作为 一 个 综合 对 象 来 考虑 。 面 向 对 象 分 析 
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技术 可 以 将 系统 的 行为 和 信息 间 的 关系 表示 为 迭代 构造 特征 。 
面向 对 象 分 析 包 含 5 个 活动 : 认定 对 象 、 组 织 对 象 、 描 述 对 象 间 的 相互 作用 、 定 义 对 象 的 
操作 、 定 义 对 象 的 内 部 信息 。 
1) 认定 对 象 
在 应 用 领域 中 ， 按 自然 存在 的 实体 确立 对 象 。 在 定义 域 中 ， 首 先 将 自然 存在 的 “名 词 ” 作 
为 一 个 对 象 ， 这 通常 是 研究 问题 、 定 义 域 实体 的 良好 开始 。 通 过 实体 间 的 关系 寻找 对 象 常常 没 
有 问题 ， 而 困难 在 于 寻找 〈 选 择 ) 系统 关心 的 实质 性 对 象 ， 实 质 性 对 象 是 系统 稳定 性 的 基础 。 
例如 在 银行 应 用 系统 中 ,实质 性 对 象 应 包含 客户 账 务 、 清 算 等 ， 而 门卫 值班 表 不 是 实质 性 对 象 ， 
甚至 可 不 包含 在 该 系统 中 。 

2) 组 织 对 象 

分 析 对 象 间 的 关系 ,将 相关 对 象 抽 象 成 类 ， 其 目的 是 为 了 简化 关联 对 象 ， 利 用 类 的 继承 性 
建立 具有 继承 性 层次 的 类 结构 。 抽 象 类 时 可 从 对 象 间 的 操作 或 一 个 对 象 是 另 一 个 对 象 的 一 部 分 
来 考虑 ;如 房子 由 门 和 窗 构成 ， 门 和 窗 是 房子 类 的 子 类 。 由 对 象 抽象 类 ， 通 过 相关 类 的 继承 构 
造 类 层次 ， 所 以 说 系统 的 行为 和 信息 间 的 分 析 过 程 是 一 种 迭代 表征 过 程 。 

3) 对 象 间 的 相互 作用 

描述 出 各 对 象 在 应 用 系统 中 的 关系 。 如 一 个 对 象 是 另 一 个 对 象 的 一 部 分 ， 一 个 对 象 与 其 他 
对 象 间 的 通信 关系 等 。 这 样 可 以 完整 地 描述 每 个 对 象 的 环境 ， 由 一 个 对 象 解释 另 一 个 对 象 ， 以 
及 一 个 对 象 如 何 生成 另 一 个 对 象 ， 最 后 得 到 对 象 的 界面 描述 。 

4) 基于 对 象 的 操作 

当 考虑 对 象 的 界面 时 ， 自 然 要 考虑 对 象 的 操作 。 其 操作 有 从 对 象 直接 标识 的 简单 操作 ， 如 
创建 、 增 加 、 删 除 等 ， 也 有 更 复杂 的 操作 ， 如 将 几 个 对 象 的 信息 连接 起 来 。 一 般 而 言 ， 避 免 对 
象 太 复杂 比较 好 ， 当 连接 的 对 象 太 复杂 时 ， 可 将 其 标识 为 新 对 象 。 当 确定 了 对 象 的 操作 后 ， 再 
定义 对 象 的 内 部 ， 对 象 内 部 定义 包括 其 内 部 数据 信息 、 信 息 存 储 方法 ， 继 承 关 系 以 及 可 能 生成 
的 实例 数 等 属性 。 

分 析 阶 段 最 重要 的 是 理解 问题 域 的 概念 ， 其 结果 将 影响 整个 工作 。 经 验 表 明 ， 从 应 用 定义 
域 概念 标识 对 象 是 非常 合理 的 ， 完 成 上 述 工 作 后 写 出 规范 文档 ， 文 档 确定 每 个 对 象 的 范围 。 

早期 面向 对 象 的 目标 之 一 是 简化 模型 与 问题 域 之 间 的 语义 差距 。 事实 上 ， 面 向 对 和 象 分 析 的 
基础 是 软件 系统 结构 ， 这 依赖 于 人 类 看 待 现实 世界 的 方法 。 当 人 们 理解 求解 问题 的 环境 时 ， 常 
采用 对 象 、 分 类 法 和 层次 性 这 类 术语 。 面 向 对 象 分 析 与 功能 /数据 分 析 方法 相 比 ， 面 向 对 象 的 结 
果 比 较 容易 理解 和 管理 。 面 向 对 象 分 析 方 法 的 另 一 个 优点 是 便于 修改 ， 早 期 阶段 的 修改 容易 提 
高 软件 的 可 靠 性 。 
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9.3 系统 设计 基础 知识 


9.3.1 系统 设计 内 容 和 步骤 


在 系统 分 析 阶 段 ， 已 经 搞 清楚 了 软件 “做 什么 ”的 问题 ， 并 把 这 些 需 求 通过 规格 说 明 书 描 
述 了 出 来 ， 这 也 是 目标 系统 的 逻辑 模型 。 进 入 设计 阶段 ， 要 把 软件 “做 什么 ”的 逻辑 模型 转换 
成 “怎么 做 ”的 物理 模型 ， 即 着 手 实现 软件 系统 的 需求 。 

系统 设计 的 主要 目的 就 是 为 系统 制定 蓝图 , 在 各 种 技术 和 实施 方法 中 权衡 利 浆 , 精心 设计 ， 
合理 使 用 各 种 资源 ， 最 终 勾画 出 新 系统 的 详细 设计 方案 。 

系统 设计 的 主要 内 容 包括 新 系统 总 体 结构 设计 、 代 码 设计 、 输 出 设计 、 输 入 设计 、 处 理 过 
程 设计 、 数 据 存储 设计 、 用 户 界面 设计 和 安全 控制 设计 等 。 

系统 设计 的 基本 任务 大 体 上 可 以 分 为 概要 设计 和 详细 设计 两 个 步骤 。 


1， 概 要 设计 的 基本 任务 


1) 设计 软件 系统 总 体 结构 

其 基本 任务 是 采用 某 种 设计 方法 ， 将 一 个 复杂 的 系统 按 功能 划分 成 模块 ; 确定 每 个 模块 的 
功能 ; 确定 模块 之 间 的 调用 关系 ; 确定 模块 之 间 的 接口 ， 即 模块 之 间 传递 的 信息 评价 模块 结 
构 的 质量 。 

软件 系统 总 体 结构 的 设计 是 概要 设计 关键 的 一 步 ， 直接 影响 到 下 一 个 阶段 详细 设计 与 编码 
的 工作 。 软 件 系 统 的 质量 及 一 些 整体 特性 都 在 软件 系统 总 体 结构 的 设计 中 决定 。 

2) 数据 结构 及 数据 库 设计 

(1) 数据 结构 的 设计 。 逐 步 细 化 的 方法 也 适用 于 数据 结构 的 设计 。 在 需求 分 析 阶 段 ， 已 经 
通过 数据 字典 对 数据 的 组 成 、 操 作 约束 和 数据 之 间 的 关系 等 方面 进行 了 描述 ， 确 定 了 数据 的 结 
构 特性 , 在 概要 设计 阶段 要 加 以 细 化 , 详细 设计 阶段 则 规定 具体 的 实现 细节 。 在 概要 设计 阶段 ， 
宜 使 用 抽象 的 数据 类 型 。 

(2) 数据 库 的 设计 。 数 据 库 的 设计 是 指数 据 存储 文件 的 设计 ， 主 要 进行 以 下 几 方面 设计 。 

@ 概念 设计 。 在 数据 分 析 的 基础 上 ， 采 用 自 底 向 上 的 方法 从 用 户 角 度 进行 视图 设计 ， 一 
般 用 ER 模型 来 表述 数据 模型 。ER 模型 既是 设计 数据 库 的 基础 ， 也 是 设计 数据 结构 的 基础 。 

@ 逻辑 设计 。ER 模型 是 独立 于 数据 库 管理 系统 (DBMS ) 的 ， 要 结合 具体 的 DBMS 特征 
来 建立 数据 库 的 逻辑 结构 。 

@ 物理 设计 。 对 于 不 同 的 DBMS， 物 理 环境 不 同 ， 提 供 的 存储 结构 与 存 取 方 法 各 不 相同 。 
物理 设计 就 是 设计 数据 模式 的 一 些 物理 细节 ， 如 数据 项 存储 要 求 、 存 取 方法 和 索引 的 建立 等 。 
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3) 编写 概要 设计 文档 

文档 主要 有 概要 设计 说 明 书 、 数 据 库 设计 说 明 书 、 用 户 手册 以 及 修订 测试 计划 。 

4) 评审 

对 设计 部 分 是 否 完整 地 实现 了 需求 中 规定 的 功能 、 性 能 等 要 求 ， 设 计 方 法 的 可 行 性 ， 关 键 
的 处 理 及 内 外 部 接口 定义 的 正确 性 、 有 效 性 、 各 部 分 之 间 的 一 致 性 等 都 一 一 进行 评审 。 


2. 详细 设计 的 基本 任务 


详细 设计 阶段 的 根本 目标 是 确定 应 该 怎样 具体 地 实现 所 要 求 的 系统 ， 也 就 是 说 ， 经 过 这 个 
阶段 的 设计 工作 ， 应 该 得 出 对 目标 系统 的 精确 描述 。 
详细 设计 阶段 的 任务 不 是 具体 地 编写 程序 ， 而 是 要 设计 出 程序 的 “蓝图 ”， 以 后 根据 这 个 
蓝图 写 出 实际 的 程序 代码 。 详 细 设 计 阶段 的 主要 任务 有 : 

(1) 对 每 个 模块 进行 详细 的 算法 设计 。 用 某 种 图 形 、 表 格 和 语言 等 工具 将 每 个 模块 处 理 过 
程 的 详细 算法 描述 出 来 。 

(2) 对 模块 内 的 数据 结构 进行 设计 。 

(3) 对 数据 库 进 行 物 理 设计 ， 即 确定 数据 库 的 物理 结构 。 

(4) 其 他 设计 。 根 据 软件 系统 的 类 型 ， 还 可 能 要 进行 以 下 设计 。 

@ 代码 设计 。 

代码 是 用 来 表征 客观 事物 的 一 组 有 序 的 符号 ， 以 便于 计算 机 和 人 工 识 别 与 处 理 。 为 了 提高 
数据 的 输入 、 分 类 、 存 储 和 检索 等 操作 ， 节 约 内 存 空 间 ， 对 数据 库 中 某 些 数据 项 的 值 要 进行 代 
码 设计 。 代 码 设计 的 原则 是 : 唯一 性 、 合 理性 、 可 扩充 性 、 简 单 性 、 适 用 性 、 规 范 性 和 系统 性 。 

@ 输入 输出 设计 。 

@ 用 户 界面 设计 。 

(5) 编写 详细 设计 说 明 书 。 

(6) 评审 。 对 处 理 过 程 的 算法 和 数据 库 的 物理 结构 都 要 评审 。 

系统 设计 的 结果 是 一 系列 的 系统 设计 文件 ， 这 些 文件 是 物理 实现 一 个 信息 系统 〈 包 括 硬件 
设备 和 编制 软件 程序 ) 的 重要 基础 。 


9.3.2 ”系统 设计 的 基本 原理 


1， 抽 象 


抽象 是 一 种 设计 技术 ， 重 点 说 明 一 个 实体 的 本 质 方面 ， 而 忽略 或 者 掩盖 不 很 重要 或 非 本 质 
的 方面 。 抽 象 是 一 种 重要 的 工具 ， 用 来 将 复杂 的 现象 简化 到 可 以 分 析 、 实 验 或 者 可 以 理解 的 程 
度 。 软 件 工程 中 从 软件 定义 到 软件 开发 要 经 历 多 个 阶段 ， 在 这 个 过 程 中 每 前 进一步 都 可 看 作 是 
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对 软件 解法 的 抽象 层次 的 一 次 细 化 。 抽 象 的 最 低层 就 是 实现 该 软件 的 源 程序 代码 。 在 进行 模块 
化 设计 时 也 可 以 有 多 个 抽象 层次 ， 最 高 抽象 层次 的 模块 用 概括 的 方式 叙述 问题 的 解法 ， 较 低 抽 
象 层次 的 模块 是 对 较 高 抽象 层次 模块 对 问题 解法 描述 的 细 化 。 


2. 模块 化 


模块 在 程序 中 是 数据 说 明 、 可 执行 语句 等 程序 对 象 的 集合 , 或 者 是 单独 命名 和 编 址 的 元 素 ， 
如 高 级 语言 中 的 过 程 、 函 数 和 子 程序 等 。 在 软件 的 体系 结构 中 ， 模 块 是 可 组 合 、 分 解 和 更 换 的 
单元 。 

模块 化 是 指 将 一 个 待 开发 的 软件 分 解 成 若干 个 小 的 简单 部 分 一 模块 ， 每 个 模块 可 独立 地 
开发 、 测 试 ， 最 后 组 装 成 完整 的 程序 。 这 是 一 种 复杂 问题 “分 而 治之 ”的 原则 。 模 块 化 的 目的 
是 使 程序 的 结构 清晰 ， 容 易 阅读 、 理 解 、 测 试 和 修改 。 


3， 信息 隐蔽 


信息 隐蔽 是 开发 整体 程序 结构 时 使 用 的 法 则 ， 即 将 每 个 程序 的 成 分 隐蔽 或 封装 在 一 个 单一 
的 设计 模块 中 ， 定 义 每 一 个 模块 时 尽 可 能 少 地 显露 其 内 部 的 处 理 。 在 设计 时 首先 列 出 一 些 可 能 
发 生变 化 的 因素 ， 在 划分 模块 时 将 一 个 可 能 发 生变 化 的 因素 隐蔽 在 某 个 模块 的 内 部 ， 使 其 他 模 
块 与 这 个 因素 无 关 。 在 这 个 因素 发 生变 化 时 ， 只 需 修改 含有 这 个 因素 的 模块 ， 而 与 其 他 模块 
无 关 。 
信息 隐蔽 原则 对 提高 软件 的 可 修改 性 、 可 测试 性 和 可 移植 性 都 有 重要 的 作用 。 


4. 模块 独立 


模块 独立 是 指 每 个 模块 完成 一 个 相对 独立 的 特定 子 功能 ， 并 且 与 其 他 模块 之 间 的 联系 简 
单 。 衡 量 模块 独立 程度 的 标准 有 两 个 : 耦合 性 和 内 聚 性 。 

1) 耦合 

耦合 性 是 指 模块 之 间 联 系 的 紧密 程度 。 耦 合 性 越 高 ， 则 模块 的 独立 性 越 差 。 模 块 间 耦 合 的 
高 低 取 决 于 模块 间接 口 的 复杂 性 、 调 用 的 方式 及 传递 的 信息 。 模 块 的 耦合 有 以 下 几 种 类 型 。 

(1) 无 直接 耦合 。 指 两 个 模块 间 没 有 直接 的 关系 , 它们 分 别 从 属于 不 同 模块 的 控制 与 调用 ， 
它们 之 间 不 传递 任何 信息 。 因 此 ， 模 块 间 耦 合 性 最 弱 ， 模 块 独立 性 最 高 。 

(2) 数据 耦合 。 指 两 个 模块 之 间 有 调用 关系 ， 传 递 的 是 简单 的 数据 值 ， 相 当 于 高 级 语言 中 
的 值 传递 。 这 种 耦合 程度 较 低 ， 模 块 的 独立 性 较 高 。 

(3) 标记 耦合 。 指 两 个 模块 之 间 传 递 的 数据 结构 ， 如 高 级 语言 中 的 数据 组 名 、 记 录 名 、 文 
件 名 等 这 些 名 字 即 为 标记 ， 其 实 传递 的 是 这 个 数据 结构 的 地 址 。 

(4) 控制 耦合 。 指 一 个 模块 调用 另 一 个 模块 时 ， 传 递 的 是 控制 变量 ， 被 调 模块 通过 该 控制 
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变量 的 值 有 选择 地 执行 块 内 的 某 一 功能 。 

(5) 公共 耦合 。 指 通过 一 个 公共 数据 环境 相互 作用 的 那些 模块 之 间 的 耦合 。 

(6) 内 容 耦 合 。 这 是 程度 最 高 的 耦合 。 当 一 个 模块 直接 使 用 另 一 个 模块 的 内 部 数据 ， 或 通 
过 非 正常 入 口 而 转 入 另 一 个 模块 内 部 ， 这 种 模块 之 间 的 耦合 为 内 容 耦 合 ， 这 种 情况 往往 出 现在 
汇编 程序 设计 中 。 

2) 内 聚 

内 聚 是 指 模块 内 部 各 元 素 之 间 联系 的 紧密 程度 ， 例 如 一 个 完成 多 个 功能 的 模块 的 内 聚 度 就 
比 完 成 单一 功能 的 模块 的 内 聚 度 低 。 内 聚 度 越 低 , 模块 的 独立 性 越 差 。 内 聚 性 有 以 下 几 种 类 型 。 

(1) 偶然 内 聚 。 指 一 个 模块 内 的 各 个 处 理 元 素 之 间 没 有 任何 联系 。 

(2) 逻辑 内 聚 。 指 模块 内 执行 几 个 逻辑 上 相似 的 功能 ， 通 过 参数 确定 该 模块 完成 哪 一 个 
功能 。 

(3) 时 间 内 聚 。 把 需要 同时 执行 的 动作 组 合 在 一 起 形成 的 模块 为 时 间 内 聚 模块 。 

(4) 通信 内 聚 。 指 模块 内 所 有 处 理 元 素 都 在 同一 个 数据 结构 上 操作 ， 或 者 指 各 处 理 使 用 相 
同 的 输入 数据 或 者 产生 相同 的 输出 数据 。 

(5) 顺序 内 聚 。 指 一 个 模块 中 各 个 处 理 元 素 都 密切 相关 于 同一 功能 且 必 须 顺序 执行 ， 前 一 
功能 元 素 的 输出 就 是 下 一 功能 元 素 的 输入 。 

(6) 功能 内 聚 。 这 是 最 强 的 内 聚 。 指 模块 内 所 有 元 素 共同 完成 一 个 功能 ， 缺 一 不 可 。 

耦合 性 和 内 聚 性 是 模块 独立 性 的 两 个 定性 标准 , 将 软件 系统 划分 模块 时 ,尽量 做 到 高 内 聚 、 
低 耦 合 ， 提 高 模块 的 独立 性 。 


9.3.3 ”系统 模块 结构 设计 


1) 模块 的 概念 

模块 是 组 成 系统 的 基本 单位 ， 它 的 特点 是 可 以 组 合 、 分 解 和 更 换 。 系 统 中 任何 一 个 处 理 功 
能 都 可 以 看 成 是 一 个 模块 。 根 据 模块 功能 具体 化 程度 的 不 同 ， 可 以 分 为 逻辑 模块 和 物理 模块 。 
在 系统 逻辑 模型 中 定义 的 处 理 功 能 可 视 为 逻辑 模块 。 物 理 模 块 是 逻辑 模块 的 具体 化 ， 可 以 是 一 
个 计算 机 程序 、 子 程序 或 若干 条 程序 语句 ， 也 可 以 是 人 工 过 程 的 菜 项 具体 工作 。 
一 个 模块 应 具备 以 下 4 个 要 素 。 
(1) 输入 和 输出 。 模 块 的 输入 来 源 和 输出 去 向 都 是 同一 个 调用 者 ， 即 一 个 模块 从 调用 者 那 
里 取得 输入 ， 进 行 加 工 后 再 把 输出 返回 给 调用 者 。 

(2) 处 理 功能 。 指 模块 把 输入 转换 成 输出 所 做 的 工作 。 

(3) 内 部 数据 。 指 仅 供 该 模块 本 身 引 用 的 数据 。 

(4) 程序 代码 。 指 用 来 实现 模块 功能 的 程序 。 

前 两 个 要 素 是 模块 外 部 特性 ， 即 反映 了 模块 的 外 貌 。 后 两 个 要 素 是 模块 的 内 部 特性 。 在 结 
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构 化 设计 中 ， 主 要 考虑 的 是 模块 的 外 部 特性 ， 其 内 部 特性 只 做 必要 了 解 ， 具 体 的 实现 将 在 系统 
实施 阶段 完成 。 

2) 模块 结构 图 

为 了 保证 系统 设计 工作 的 顺利 进行 ， 结 构 设计 应 遵循 如 下 原则 。 

(1) 所 划分 的 模块 其 内 部 的 凝聚 性 要 强 , 模块 之 间 的 联系 要 少 , 即 模块 具有 较 强 的 独立 性 。 

(2) 模块 之 间 的 连接 只 能 存在 上 下 级 之 间 的 调用 关系 ， 不 能 有 同 级 之 间 的 横向 联系 。 

(3) 整个 系统 呈 树 状 结构 ， 不 允许 网 状 结 构 或 交叉 调用 关系 出 现 。 

(4) 所 有 模块 〈 包 括 后 继 IPO 图 ) 都 必须 严格 地 分 类 编码 并 建立 归档 文件 。 

模块 结构 图 主要 关心 的 是 模块 的 外 部 属性 ， 即 上 下 级 模块 、 同 级 模块 之 间 的 数据 传递 和 调 
用 关系 ， 并 不 关心 模块 的 内 部 。 

模块 结构 图 是 结构 化 设计 中 描述 系统 结构 的 图 形 工具 。 作 为 一 种 文档 ， 它 必须 严格 地 定义 
模块 的 名 字 、 功 能 和 接口 ， 同 时 还 应 当 在 模块 结构 图 上 反映 出 结构 化 设计 的 思想 。 

模块 结构 图 由 模块 、 调 用 、 数 据 、 控 制 和 转 接 5 种 基本 符号 组 成 ， 如 图 9-22 所 示 ， 现 说 


明 如 下 。 
"CY ~ © = 9 


模块 调用 数据 控制 信息 转 接 符号 
图 9-22 模块 结构 图 的 基本 符号 
。 ”模块 。 这 里 所 说 的 模块 通常 是 指 用 一 个 名 字 就 可 以 调用 的 一 段 程 序 语句 。 长 方形 中 间 
标 上 能 反映 模块 处 理 功 能 的 模块 名 字 。 
。 调用。 箭头 总 是 由 调用 模块 指向 被 调用 模块 ， 但 是 应 该 理解 被 调用 模块 执行 后 又 返回 
到 调用 模块 。 
若 一 个 模块 是 否 调用 一 个 从 属 模块 由 调用 模块 内 部 的 判断 条 件 决定 , 则 该 调用 模块 间 的 判断 
调用 采用 萎 形 符号 表示 。 若 一 个 模块 通过 其 内 部 的 循环 功能 来 循环 调用 一 个 或 多 个 从 属 模 块 ， 则 
该 调用 称 为 循环 调用 ， 用 弧 形 箭头 表示 。 判 断 调用 和 循环 调用 的 表示 方法 如 图 9-23 所 示 。 


、 


(a) 调用 (b) 判断 调用 (c) 循环 调用 
图 9-23 ”模块 调用 示例 
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。 ”数据 。 当 一 个 模块 调用 另 一 个 模块 时 ， 调 用 模块 可 以 把 数据 传送 到 被 调用 模块 以 供 处 
理 ， 而 被 调用 模块 又 可 以 将 处 理 的 结构 送 回 到 被 调用 模块 。 在 模块 之 间 传送 的 数据 ， 
使 用 与 调用 箭头 平行 的 带 空心 圆 的 箭头 表示 ， 并 在 旁边 标 上 数据 名 。 图 9-24 (a) 表示 
模块 A 调用 模块 B 时 ，A 将 数据 x、y 传送 给 B，B 将 处 理 结果 数据 z 返回 给 A。 

。 ”控制 信息 。 模 块 间 有 时 还 必须 传送 某 些 控制 信息 。 例 如 ， 数 据 输入 完成 后 给 出 的 结束 


标志 ， 文 件 读 到 末尾 时 所 产生 的 文件 结束 标志 等 。 控 制 信息 与 数据 的 主要 区 别 是 前 者 


只 反映 数据 的 某 种 状态 ， 不 必 进 行 处 理 。 图 9-24 〈b) 中 “无 此 职工 ”就 是 用 来 表示 
送 来 的 职工 号 有 误 的 控制 信息 。 
。 ” 转 接 符 号 。 当 模块 结构 图 在 一 张 纸 上 画 不 下 ， 需 要 转 接 到 另 一 张 纸 上 ,或 者 为 了 避免 
图 上 线条 交叉 时 ， 都 可 以 使 用 转 接 符号 ， 圆 圈 内 加 上 标号 ， 如 图 


9-25 所 示 。 


图 9-24 模块 间 的 数据 传递 图 9-25 转 接 符 号 的 使 用 


9.3.4 ”结构 化 设计 方法 


结构 化 设计 〈Structured Design，SD ) 方法 是 一 种 面向 数据 流 的 设计 方法 ， 它 可 以 与 SA 方 
法 衔接 。 结构 化 设计 方法 的 基本 思想 是 将 系统 设计 成 由 相对 独立 、 功 能 单一 的 模块 组 成 的 结构 。 


1. 信息 流 的 类 型 


在 需求 分 析 阶 段 , 用 SA 方法 产生 了 数据 流 图 。 面向 数据 流 的 设计 能 方便 地 将 DFD 转换 成 
程序 结构 图 。 DFD 中 从 系统 的 输入 数据 流 到 系统 的 输出 数据 流 的 一 连 串 连续 变换 形成 了 一 条 信 


息 流 。DFD 的 信息 流 大 体 上 可 以 分 为 两 种 类 型 ， 变换 流 和 事务 流 。 


(1) 变换 流 。 信 息 沿 着 输入 通路 进入 系统 ， 同 时 将 信息 的 外 部 形式 转换 成 内 部 表示 ， 然 后 
通过 变换 中 心 〈 也 称 主 加 工 ) 处 理 ， 再 沿 着 输出 通路 转换 成 外 部 形式 离开 系统 。 具 有 这 种 特性 


的 信息 流 称 为 变换 流 。 变 换 流 型 的 DFD 可 以 明显 地 分 成 输入 、 变 换 (3 


加 工 ) 和 输出 三 大 
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部 分 。 

(2) 事务 流 。 信 息 沿 着 输入 通路 到 达 一 个 事务 中 心 ， 事 务 中 心 根据 输入 信息 〈 即 事务 ) 的 
类 型 在 若干 个 动作 序列 〈 称 为 活动 流 ) 中 选择 一 个 来 执行 ， 这 种 信息 流 称 为 事务 流 。 事 务 流 有 
明显 的 事务 中 心 ， 各 活动 流 以 事务 中 心 为 起 点 呈 辐 射 状 流出 。 


2. 变换 分 析 


变换 分 析 是 从 变换 流 型 的 DFD 导出 程序 结构 图 。 

1) 确定 输入 流 和 输出 流 ， 分 离 出 变换 中 心 

把 DFD 中 系统 输入 端的 数据 流 称 为 物理 输入 ， 系 统 输出 端的 数据 流 称 为 物理 输出 。 物 理 
输入 通常 要 经 过 编辑 、 格 式 转换 、 合 法 性 检查 、 预 处 理 等 辅助 性 的 加 工 才能 为 主 加 工 的 真正 输 
入 〔 称 为 逻辑 输入 )。 从 物理 输入 端 开始 ， 一 步 步 向 系统 的 中 间 移 动 ， 可 找到 离 物 理 输入 端 最 
远 ， 但 仍 可 被 看 作 系统 输入 的 那个 数据 流 ， 这 个 数据 流 就 是 逻辑 输入 。 同 样 ， 由 主 加 工 产 生 的 
输出 〈 称 为 逻辑 输出 ) 通常 也 要 经 过 编辑 、 格 式 转换 、 组 成 物理 块 、 缓 冲 处 理 等 辅助 加 工 才能 
变 成 物理 输出 。 从 物理 输出 端 开 始 ， 一 步 步 向 系统 的 中 间 移 动 ， 可 找到 离 物理 输出 端 最 远 ， 但 
仍 可 被 看 作 系统 输出 的 那个 数据 流 ， 这 个 数据 流 就 是 逻辑 输出 。 

DFD 中 从 物理 输入 到 逻辑 输入 的 部 分 构成 系统 的 输入 流 , 从 逻辑 输出 到 物理 输出 的 部 分 构 
成 系统 的 输出 流 ， 位 于 输入 流 和 输出 流 之 间 的 部 分 就 是 变换 中 心 。 


[ 


2) 第 一 级 分 解 
第 一 级 分 解 主要 是 设计 模块 结构 的 顶层 和 第 一 层 。 一 个 变换 流 型 的 DED 可 映射 成 图 9.26 
所 示 的 程序 结构 图 。 图 中 项 层 模块 的 功能 就 是 整个 
屋 模块 
系统 的 功能 输入 控制 模块 用 来 接收 所 有 的 输入 数 


据 , 变换 控制 模块 用 来 实现 输入 到 输出 的 变换 , 输 


出 控制 模块 用 来 产生 所 有 的 输出 数据 。 输入 控制 | 。 | 变换 控制 | | 输出 控制 
3) 第 二 级 分 解 
第 二 级 分 解 主要 是 设计 中 、 下 层 模块 。 图 9.26 变换 分 析 的 第 一 级 分 解 


(1) 输入 控制 模块 的 分 解 。 从 变换 中 心 的 边 
界 开始 ， 沿 着 每 条 输入 通路 ， 把 输入 通路 上 的 每 个 加 工 映 射 成 输入 控制 模块 的 一 个 低层 模块 。 

(2) 输出 控制 模块 的 分 解 。 从 变换 中 心 的 边界 开始 ， 沿 着 每 条 输出 通路 ， 把 输出 通路 上 的 
每 个 加 工 映 射 成 输出 控制 模块 的 一 个 低层 模块 。 

(3) 变换 控制 模块 的 分 解 。 变 换 控制 模块 通常 没有 通用 的 分 解 方法 ， 应 根据 DFD 中 变换 
部 分 的 实际 情况 进行 设计 。 

4) 事务 分 析 
事务 分 析 是 从 事务 流 型 DFD 导出 程序 结构 图 。 
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(1) 确定 事务 中 心 和 每 条 活动 流 的 流 特性 。 图 9-27 给 出 了 事务 流 型 DFD 的 一 般 形 式 。 其 
中 事务 中 心 (图 中 的 T) 位 于 数 条 活动 流 的 起 点 ， 这 些 活动 流 从 该 点 呈 辐 射 状 地 流出 。 每 条 活 
动 流 也 是 一 条 信息 流 ， 它 可 以 是 变换 流 ， 也 可 以 是 另 一 条 事务 流 。 一 个 事务 流 型 的 DFD 由 输 
入 流 、 事 务 中 心 和 若干 条 活动 流 组 成 。 

(2) 将 事务 流 型 DFD 映射 成 高 层 的 程序 结构 。 事 务 流 型 DFD 的 高 层 结构 如 图 9-28 所 示 。 
顶层 模块 的 功能 就 是 整个 系统 的 功能 。 接 收 模块 用 来 接收 输入 数据 ， 它 对 应 于 输入 流 。 发 送 模 
块 是 一 个 调度 模块 ， 控 制 下 层 的 所 有 活动 模块 。 每 个 活动 流 模块 对 应 于 一 条 活动 流 ， 它 也 是 该 
活动 流 映射 成 的 程序 结构 图 中 的 顶层 模块 。 

(3) 进一步 分 解 。 接 收 模 块 的 分 解 类 同 于 变换 分 析 中 输入 控制 模块 的 分 解 。 每 个 活动 流 模 
块根 据 其 流 特性 变换 流 或 事务 流 ) 进一步 采用 变换 分 析 或 事务 分 析 进 行 分 解 。 


,--~X( 活 动 流 
“5 : 


顶层 模块 
输入 流 发 送 接收 
| 
| | 
活动 流 1 活动 流 2 | … | 活动 流 n 
图 9-27 事务 流 图 9-28 事务 流 型 DFD 的 高 层 程序 结构 


5) SD 方法 的 设计 步骤 

(1) 复查 并 精 化 数据 流 图 。 

(2) 确定 DFD 的 信息 流 类 型 〈 变 换 流 或 事务 流 )。 
(3) 根据 流 类 型 分 别 实施 变换 分 析 或 事务 分 析 。 
(4) 根据 系统 设计 的 原则 对 程序 结构 图 进行 优化 。 


9.3.5 面向 对 象 设计 方法 

面向 对 象 设计 (Object-Oriented Design，OOD) 是 OOA 方法 的 延续 ， 是 在 OOA 模型 基础 
上 运用 面向 对 象 方法 , 主要 解决 与 实现 有 关 的 问题 , 目标 是 产生 一 个 符合 具体 实现 条 件 的 OOD 
模型 。 由 于 OOD 以 OOA 模型 为 基础 ， 且 OOA 与 OOD 采用 一 致 的 表示 法 ， 这 使 得 从 OOA 到 
OOD 不 存在 转换 ， 只 需 做 必要 的 修改 和 调整 。 
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1. 设计 软件 类 
类 封装 了 信息 和 行为 ， 是 面向 对 象 的 重要 组 成 部 分 ， 它 是 具有 相同 


属性 、 方 法 和 关系 的 对 


象 集合 的 总 称 。 在 系统 中 ， 每 个 类 都 具有 一 定 的 职责 ， 职 责 是 指 类 所 承担 的 任务 。 设 计 类 是 
OOD 中 最 重要 的 组 成 部 分 。 在 系统 设计 中 ， 类 可 以 分 为 三 种 类 型 : 实体 类 、 边 界 类 和 控制 类 。 


(1) 实体 类 


实体 类 通常 对 应 现实 生活 中 的 实体 ， 它 包含 了 用 于 描述 实体 的 不 同 实例 的 信息 称 为 属 
性 )， 还 封装 了 维护 其 信息 或 属性 的 行为 〈 称 为 方法 )， 它 们 是 系统 的 核心 。 


实体 类 是 对 用 户 来 说 最 有 意义 的 类 ， 通 常 采 用 业务 领域 术语 命名 ， 
(2) 边界 类 


一 般 来 说 是 一 个 名 词 。 


有 户 通过 边界 类 实现 的 用 户 界面 与 系统 通信 。 描 述 用 户 直接 通过 系统 交互 的 用 例 功能 应 放 


在 边界 类 中 。 每 个 参与 者 或 用 户 都 要 通过 各 自 的 边界 类 同系 统 通信 。 边 界 类 将 系统 与 其 外 部 环 


境 的 变更 分 隔 开 ， 使 这 些 变更 不 会 对 系统 的 其 他 部 分 做 成 影响 。 
(3) 控制 类 


控制 类 实现 系统 的 业务 逻辑 或 业务 规则 , 一般 来 说 。 每 个 用 例 由 一 个 或 多 个 控制 类 来 实现 。 
控制 类 通过 向 实体 类 发 送 消 息 和 从 实体 类 接收 销售 ， 处 理 来 自 边界 类 的 消息 并 响应 这 些 消息 。 


控制 类 用 于 对 一 个 或 几 个 用 例 所 特有 的 控制 行为 进行 建 模 。 
2， 面向 对 象 设计 过 程 


的 实际 情况 。 
面向 对 象 设计 主要 包括 以 下 活动 。 
(1) 对 用 例 模 型 加 以 精炼 以 反映 实现 环境 


面向 对 象 设计 期 间 ， 需 要 对 面向 对 象 分 析 期 间 得 到 的 模型 加 以 精炼 ， 以 反映 所 建议 的 方案 


在 对 用 例 模 型 的 精炼 过 程 中 ， 参 与 者 如 何 实际 地 与 系统 进行 交互 、 系 统 如 何 响应 激励 处 理 
业务 事件 的 细节 以 及 用 户 访问 系统 的 方法 等 都 应 该 被 详细 地 描述 ， 将 OOA 得 到 的 分 析 用 例 转 


换 成 设计 用 例 。 


所 有 的 系统 分 析 用 例 被 转换 成 设计 用 例 后 ， 可 能 会 发 现 新 的 用 例 、 用 例 关系 甚至 参与 者 ， 


所 以 在 这 个 活动 中 应 对 用 例 模 型 进行 适当 的 修改 。 
(2) 建 模 支 持 用 例 情景 的 对 象 交 互 、 行 为 和 状态 


在 这 个 活动 中 ， 将 确定 并 分 类 设计 类 〈 即 实体 类 、 边 界 类 和 控制 类 )， 这 些 设计 类 说 明了 


用 例 中 的 功能 需求 ， 并 且 还 要 确定 类 之 间 的 交互 、 类 责任 和 行为 。 
(3) 修改 对 象 模型 以 反映 实现 环境 


一 旦 设计 了 对 象 及 其 所 需 的 交互 ， 就 可 以 对 类 图 加 以 精炼 ， 以 表示 应 用 程序 中 的 软件 类 ， 
将 分 析 类 图 转换 为 设计 类 图 。 设 计 类 图 通常 包括 以 下 内 容 : 类 ; 关联 关系 、 泛 化 / 特 化 关系 、 聚 


集 关 系 ; 属性 和 属性 类 型 信息 ; 带 参数 的 方法 ， 导 航 能 力 和 依赖 关系 。 
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9.3.6 ”系统 输入 输出 设计 


1. 输出 设计 


从 系统 开发 的 角度 看 ， 输 出 决定 输入 ， 即 输入 信息 只 有 根据 输出 要 求 才 能 确定 。 输 出 设计 
包括 以 下 几 方面 的 内 容 。 

(1) 确定 输出 内 容 。 输 出 内 容 的 设计 首先 要 确定 用 户 在 使 用 信息 方面 的 要 求 。 根 据 用 户 要 
求 ， 设 计 输 出 信息 的 内 容 ， 包 括 信息 形式 〈 表 格 、 图 形 、 文 字 )、 输 出 项 目 及 数据 结构 、 数 据 
类 型 、 位 数 及 取 值 范围 、 数 据 的 生成 途径 、 完 整 性 及 一 致 性 的 考虑 等 。 

(2) 选择 输出 设备 与 介质 。 常 用 的 输出 设备 有 显示 终端 、 打 印 机 、 磁 带 机 、 绘 图 仪 、 缩 微 
胶卷 输出 器 和 多 媒体 设备 。 输 出 介质 有 纸张 、 磁 带 、 磁 盘 、 缩 微 胶卷 、 光 盘 和 多 媒体 介质 等 。 
这 些 设备 和 介质 各 有 特点 ， 应 根据 用 户 对 输出 信息 的 要 求 ， 结 合 现 有 设备 和 资金 条 件 选 择 。 

(3) 确定 输出 格式 。 输 出 格式 要 满足 使 用 者 的 要 求 和 习惯 ， 做 到 格式 清晰 、 美 观 、 易 于 
读 和 理解 。 

最 终 和 输出 方式 常用 的 只 有 两 种 : 报表 输出 和 图 形 输出 。 采 用 哪 种 输出 形式 为 宜 ， 应 根据 系 
统 分 析 和 管理 业务 的 要 求 而 定 。 一 般 来 说 ， 对 于 基层 和 具体 事务 的 管理 者 ， 应 用 报表 方式 给 出 
详细 的 记录 数据 为 宜 ， 而 对 于 高 层 领导 或 宏观 、 综 合 管理 部 门 ， 则 应 该 使 用 图 形 方 式 用 以 显示 
综合 数据 或 发 展 趋 势 等 信息 。 


2， 输 入 设计 


输入 设计 的 目的 是 保证 向 系统 输入 正确 的 数据 。 在 此 前 提 下 ， 做 到 输入 方法 简单 、 迅 速 、 
经 济 、 方 便 。 为 此 ， 输 入 设计 应 遵循 以 下 原则 。 

(1) 最 小 量 原则 。 这 就 是 保证 满足 处 理 要 求 的 前 提 下 使 输入 量 最 小 。 输 入 量 越 少 ， 出 错 机 
会 越 小 ， 花 费时 间 越 少 ， 数 据 一 致 性 越 好 。 

(2) 简单 性 原则 。 输 入 的 准备 、 输 入 过 程 应 尽量 容易 ， 以 减少 错误 的 发 生 。 

(3) 早 检验 原则 。 对 输入 数据 的 检验 尽量 接近 源 数 据 发 生 点 ， 使 错误 能 及 时 得 到 改正 。 

(4) 少 转换 原则 。 输 入 数据 尽量 使 用 其 处 理 所 需 的 形式 记录 ， 以 免 数 据 转换 介质 时 发 生 
错误 。 

输入 设计 的 内 容 如 下 。 

(1) 确定 输入 数据 内 容 。 包 括 确定 输入 数据 项 名 称 、 数 据 内 容 、 精 度 和 数值 范围 。 

(2) 输入 方式 设计 。 主 要 是 根据 总 体 设计 和 数据 库 设计 的 要 求 来 确定 数据 输入 的 具体 形式 。 
常用 的 输入 方式 有 键盘 输入 ， 模 / 数 、 数 / 模 输 入 ， 网 络 数据 传送 ， 磁 /光盘 读 入 等 。 通 常 在 设计 
新 系统 的 输入 方式 时 ， 应 尽量 利用 已 有 的 设备 和 资源 ， 避 免 大 批量 的 数据 通过 键盘 输入 。 


阅 


T 
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(3) 输入 格式 设计 。 实 际 设计 数据 输入 特别 是 大 批量 的 数据 统计 报表 输入 〉 时， 常常 遇 


到 统计 报表 


(文件 ) 结构 与 数据 库 文件 结构 不 完全 一 致 的 情况 ， 如 有 可 能 ， 应 尽量 改变 统计 报 


表 或 数据 库 关 系 表 二 者 之 一 的 结构 ， 使 其 一 致 ， 以 减少 输入 格式 设计 的 难度 。 现 在 还 可 采用 智 


E 输 入 方式 ， 


由 计算 机 自动 将 输入 送 至 不 同 表格 。 


(4) 校对 方式 设计 。 特 别 是 针对 数字 、 金 额 数 等 字段 ， 没 有 适当 的 校对 措施 作 保 证 是 很 危 
险 的 。 所 以 对 一 些 重要 的 报表 ， 输 入 设计 一 定 要 考虑 适当 的 校对 措施 ， 以 减少 出 错 的 可 能 性 。 


但 应 指出 的 是 ， 绝 对 保证 不 出 错 的 校对 方式 是 没有 的 。 


常用 的 校对 方式 有 人 工 校对 、 二 次 输入 校对 《同一 批 数据 两 次 输入 ) 和 数据 平衡 校对 。 


9.3.7 ”处 理 过 程 设 计 


总 体 结构 设计 将 系统 分 解 成 许多 模块 ， 并 决定 了 每 个 模块 的 外 部 特征 : 功能 和 界面 。 计 算 
机 处 理 过 程 的 设计 则 要 确定 每 个 模块 的 内 部 特征 ， 即 内 部 的 执行 过 程 ， 包 括 局 部 的 数据 组 织 、 
控制 流 、 每 一 步 的 具体 加 工 要 求 及 种 种 实施 细节 。 通 过 这 样 的 设计 ， 为 编写 程序 制定 一 个 周密 


的 计划 。 


处 理 过 程 设 计 的 关键 是 用 一 种 合适 的 表达 方法 来 描述 每 个 模块 的 执行 过 程 。 这 种 表示 方法 
应 该 简明 、 精 确 ， 并 由 此 能 直接 导出 用 编程 语言 表示 的 程序 。 常 用 的 描述 方式 有 图 形 、 语 言 
表格 三 类 ， 如 传统 的 框图 、 各 种 程序 语言 和 判定 表 等 。 


1， 程 序 流程 图 


流程 图 
程 图 包括 三 和 


图 形 表示 的 优点 是 直观 、 形 象 、 容 易 理解 。 但 从 结构 化 程序 设计 的 角度 看 ， 流 程 图 不 是 理 


(Flow Chart) 即 程序 框图 ， 是 历史 最 久 、 流 行 最 广 的 一 种 图 形 表 示 方 法 。 程 序 流 
基本 成 分 : 加 工 步骤 ， 用 方 框 表 示 ;， 逻辑 条 件 ， 用 葵 形 表示 ; 控制 流 ， 用 箭头 表示 。 


想 的 表达 工具 。 缺点 之 一 是 表示 控制 的 第 头 过 于 灵活 。 使 用 得 当 ， 流程 图 简单 易 懂 ; 使 用 不 当 ， 


流程 图 可 能 
数据 。 


E 常 难 懂 ， 而 且 无 法 维护 。 流 程 图 的 另 一 个 缺点 是 只 描述 执行 过 程 而 不 能 描述 有 关 


2. 盒 图 (NS 图 ) 


盒 图 是 结构 化 程序 设计 出 现 之 后 ， 为 支持 这 种 设计 方法 而 产生 的 一 种 描述 工具 。 在 NS 图 


中 ， 每 个 处 理 步骤 用 一 个 盒子 表示 ， 盒 子 可 以 嵌 套 。 盒 子 只 能 从 上 头 进入 ， 从 下 头 走出 ， 除 此 


之 外 别 无 其 他 出 入 口 ， 所 以 盒 图 限制 了 随意 的 控制 转移 ， 保 证 了 程序 的 良好 结构 。 
3. 形式 语言 


形式 语言 是 用 来 描述 模块 具体 算法 的 、 非 正式 的 、 比 较 灵 活 的 语言 。 其 外 层 语法 是 确定 的 ， 
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而 内 层 语法 不 确定 。 外 层 语法 描述 控制 结构 时 使 用 类 似 于 一 般 编程 语言 的 保留 字 ， 所 以 是 确定 
的 。 内 层 语法 故意 不 确定 ， 可 以 按 系统 的 具体 情况 和 不 同 层次 灵活 选用 ， 实 际 上 可 用 自然 语言 
来 描述 具体 操作 。 
J 以 看 出 ， 形 式 语言 同 结构 性 语言 的 想法 是 一 致 的 。 形 式 语言 的 优点 是 接近 自然 语言 ( 英 
语 )， 所 以 易于 理解 。 另 外 ， 它 可 以 作为 注释 嵌 套 在 程序 中 成 为 内 部 文档 ， 提 高 程序 的 自我 描 
述 性 。 同 时 ， 由 于 是 语言 形式 ， 易 于 被 计算 机 处 理 ， 所 以 可 用 行 编辑 程序 或 字 处 理 系统 对 形式 
语言 进行 编辑 修改 。 


4. 决策 树 
如 果 一 个 加 工 决策 或 判断 的 步骤 较 多 ， 则 使 用 形式 语言 时 ， 语 句 的 嵌 套 层次 太 多 ， 不 便于 


基本 加 工 的 逻辑 功能 的 清晰 描述 。 决 策 树 是 一 种 图 形 工具 ， 适 合 于 描述 加 工 中 具有 多 个 策略 且 
每 个 策略 和 若干 条 件 有 关 的 逻辑 功能 。 


5. 决策 表 


在 基本 加 工 中 ， 如 果 判 断 的 条 件 较 多 ， 各 条 件 又 相互 组 合 且 相应 的 决策 方案 较 多 的 情形 下 
用 决策 树 来 描述 ， 树 的 结构 比较 复杂 ， 图 中 各 项 注释 比较 烦琐 。 决 策 表 也 是 一 种 图 形 工具 ， 呈 
表 形 。 决 策 表 将 比较 复杂 的 决策 问题 简洁 、 明 确 、 一 目 了 然 地 描述 出 来 。 


9.4 系统 实施 基础 知识 


纪 | 


9.4.1 系统 实施 概述 


1， 系统 实施 的 目的 和 任务 


系统 实施 是 新 系统 开发 工作 的 最 后 一 个 阶段 。 所 谓 实施 ， 指 的 是 将 系统 设计 阶段 的 结果 在 
计算 机 上 实现 , 将 原来 纸 面 上 的 、 类 似 于 设计 图 式 的 新 系统 方案 转换 成 可 执行 的 应 用 软件 系统 。 
系统 实施 阶段 的 主要 任务 如 下 。 

(1) 按 总 体 设计 方案 购置 和 安装 计算 机 网 络 系统 。 硬 件 准备 包括 计算 机 主机 、 输 入 输出 设 
备 、 存 储 设备 、 辅 助 设备 〈 稳 压 电 源 、 空 调 设备 等 ) 和 通信 设备 等 。 购 置 、 安 装 和 调试 这 些 设 
备 要 花费 大 量 的 人 力 、 物 力 ， 并 且 持续 相当 长 的 时 间 。 

(2) 软件 准备 。 软 件 准备 包括 系统 软件 、 数 据 库 管 理 系统 以 及 一 些 应 用 程序 。 这 些 软件 有 
些 需 要 购买 ， 有 些 需要 组 织 人 力 编号。 编写 程序 是 系统 实施 阶段 的 重要 任务 之 一 。 

(3) 培训 。 主 要 指 用 户 的 培训 ， 包 括 主管 人 员 和 业务 人 员 。 这 些 人 多 数 来 自 现行 系统 ， 精 
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通 业 务 ， 但 往往 缺乏 计算 机 知识 。 为 了 保证 系统 调试 和 运行 顺利 进行 ， 应 根据 他 们 的 基础 提前 
进行 培训 ， 使 他 们 适应 、 逐 步 熟 悉 新 的 操作 方法 。 

(4) 数据 准备 。 数 据 的 收集 、 整 理 、 录 入 是 一 项 既 繁 重 、 劳 动量 又 大 的 工作 。 而 没有 一 定 
基础 数据 的 准备 ， 系 统 调试 就 不 可 能 很 好 地 进行 。 一 般 来 说 ， 确 定数 据 库 模型 之 后 ， 就 应 进行 
数据 的 整理 、 录 入 。 这 样 既 分 散 了 工作 量 ， 又 可 以 为 系统 调试 提供 真实 的 数据 。 

(5) 投入 转换 和 试 运行 。 

在 系统 实施 过 程 中 ， 还 有 若干 非 技 术 因 素 的 影响 。 信 息 系 统 的 最 终 受 益 人 是 企业 的 最 高 领 
导 层 ， 信 息 系统 建设 涉及 到 企业 机 构 、 权 限 的 重组 ， 只 有 具备 进行 变革 权利 的 人 才能 真正 地 推 
进 企 业 信息 化 。 

企业 在 推行 管理 信息 化 时 ， 总 经 理 首先 要 了 解 企 业 一 些 公众 的 心理 ， 如 企业 的 各 级 员工 的 
习惯 心理 ， 对 信息 系统 使 用 持 不 信任 态度 的 怀疑 性 排斥 心理 。 此 外 ， 信 息 系统 的 使 用 将 传统 的 
金字 塔 管理 变 为 扁平 管理 ， 使 以 前 无 法 暴露 的 灰色 行为 被 一 览 无 遗 ， 素质 较 低 或 年 龄 较 大 的 员 
工 对 操作 计算 机 系统 具有 蝴 惧 心理 。 如 果 没 有 妥善 的 培训 或 疏导 ， 这 些 都 将 成 为 系统 应 用 的 极 
大 障碍 。 


2 系统 实施 的 步骤 


系统 开发 工作 沿 着 信息 系统 的 生命 周期 逐渐 推进 ， 经 过 详细 设计 阶段 后 ， 便 进入 系统 实施 
阶段 。 

(1) 按 总 体 设计 方案 购置 和 安装 计算 机 网 络 系统 。 购 置 和 安装 硬件 是 比较 简单 的 事情 ， 只 
需要 按 总 体 设计 的 要 求 和 可 行 性 报告 中 财力 资源 的 分 析 ， 选 择 好 价格 性 能 比 高 的 设备 ， 通 知 供 
货 厂 家 按 要 求 供 货 并 安装 即 可 。 

(2) 建立 数据 库 系 统 。 如 果 前 面 数据 与 数据 流程 分 析 以 及 数据 库 设计 工作 进行 得 比较 规范 ， 
而 且 开 发 者 又 对 数据 库 技术 比较 熟悉 的 话 ， 按 照 数 据 库 设计 的 要 求 上 内 需 1 一 2 个 人 一 天 即 可 建 
立 起 一 个 大 型 数据 库 结构 。 

(3) 程序 设计 。 

(4) 收集 有 关 数 据 并 进行 录入 工作 ， 然 后 进行 系统 测试 。 

(5) 人 员 培 训 、 系 统 转换 和 试 运 行 。 


9.4.2 ”系统 测试 


1.， 系统 测试 的 意义 、 目 的 及 原则 


系统 测试 是 为 了 发 现 错误 而 执行 程序 的 过 程 ， 成 功 的 测试 是 发 现 了 至 今 尚 未 发 现 的 错误 的 
测试 。 
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测试 的 目的 就 是 希望 能 以 最 少 的 人 力 和 时 间 发 现 潜在 的 各 种 错误 和 缺陷 。 应 根据 开发 各 阶 
段 的 需求 、 设 计 等 文档 或 程序 的 内 部 结构 精心 设计 测试 实例 ， 并 利用 这 些 实例 来 运行 程序 ， 以 
便 发 现 错误 的 过 程 。 信 息 系统 测试 应 包括 软件 测试 、 硬 件 测试 和 网 络 测试 。 硬 件 测试 、 网 络 测 
试 可 以 根据 具体 的 性 能 指标 来 进行 ， 此 处 所 说 的 测试 更 多 是 指 软件 测试 。 

系统 测试 是 保证 系统 质量 和 可 靠 性 的 关键 步骤 ， 是 对 系统 开发 过 程 中 的 系统 分 析 、 系 统 设 
计 和 实施 的 最 后 复查 。 根 据 测试 的 概念 和 目的 ， 在 进行 信息 系统 测试 时 应 遵循 以 下 基本 原则 。 

(1) 应 尽早 并 不 断 地 进行 测试 。 测 试 不 是 在 应 用 系统 开发 完 之 后 才 进 行 的 。 由 于 原始 问题 
的 复杂 性 、 开 发 各 阶段 的 多 样 性 以 及 参加 人 员 之 间 的 协调 等 因素 ， 使 得 在 开发 各 个 阶段 都 有 可 
能 出 现 错误 。 因 此 ， 测 试 应 贯穿 在 开发 的 各 个 阶段 ， 尽 早 纠 正 错误 ， 消 除 隐 患 。 

(2) 测试 工作 应 该 避免 由 原 开 发 软件 的 人 或 小 组 承担 ， 一 方面 ， 开 发 人 员 往 往 不 愿 否认 自 
己 的 工作 ,总 认为 自己 开发 的 软件 没有 错误 ; 另 一 方面 , 开发 人 员 的 错误 很 难 由 本 人 测试 出 来 ， 
很 容易 根据 自己 编程 的 思路 来 制定 测试 思路 ， 具 有 局 限 性 。 测 试 工作 应 由 专门 人 员 来 进行 ， 会 
更 客观 ， 更 有 效 。 

(3) 设计 测试 方案 时 ， 不 仅 要 确定 输入 数据 ， 而 且 要 根据 系统 功能 确定 预期 输出 结果 。 将 
实际 输出 结果 与 预期 结果 相 比较 就 能 发 现 测试 对 象 是 否 正确 。 

(4) 在 设计 测试 用 例 时 ， 不 仅 要 设计 有 效 合理 的 输入 条 件 ， 也 要 包含 不 合理 、 失 效 的 输入 
条 件 。 测 试 的 时 候 ， 人 们 往往 习惯 按照 合理 的 、 正 常 的 情况 进行 测试 ， 而 忽略 了 对 异常 、 不 合 
理 、 意 想不到 的 情况 进行 测试 ， 而 这 些 可 能 就 是 隐患 。 

(5) 在 测试 程序 时 ， 不 仅 要 检验 程序 是 否 做 了 该 做 的 事 ， 还 要 检验 程序 是 否 做 了 不 该 做 的 
事 。 多 余 的 工作 会 带 来 副作用 ， 影 响 程序 的 效率 ， 有 时 会 带 来 潜在 的 危害 或 错误 。 

(6) 严格 按照 测试 计划 来 进行 ， 避 免 测 试 的 随意 性 。 测 试 计划 应 包括 测试 内 容 、 进 度 安排 、 
人 员 安 排 、 测 试 环境 、 测 试 工具 和 测试 资料 等 。 严 格 地 按照 测试 计划 可 以 保证 进度 ， 使 各 方面 
都 得 以 协调 进行 。 

(7) 妥善 保存 测试 计划 、 测 试用 例 ， 作 为 软件 文档 的 组 成 部 分 ， 为 维护 提供 方便 。 

(8) 测试 例子 都 是 精心 设计 出 来 的 ， 可 以 为 重新 测试 或 追加 测试 提供 方便 。 当 纠正 错误 、 
系统 功能 扩充 后 ， 都 需要 重新 开始 测试 ， 而 这 些 工作 重复 性 很 高 ， 可 以 利用 以 前 的 测试 用 例 ， 
或 在 其 基础 上 修改 ， 然 后 进行 测试 。 


2， 测试 过 程 

测试 是 开发 过 程 中 一 个 独立 且 非 常 重要 的 阶段 。 测 试 过 程 基本 上 与 开发 过 程 平行 进行 。 
一 个 规范 化 的 测试 过 程 通 常 包括 以 下 基本 的 测试 活动 。 

(1) 制定 测试 计划 。 在 制定 测试 计划 时 ， 要 充分 考虑 整个 项 目的 开发 时 间 和 开发 进度 以 及 
些 人 为 因素 和 客观 条 件 等 ， 使 得 测试 计划 是 可 行 的 。 测 试 计划 的 内 容 主 要 有 测试 的 内 容 、 进 
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度 安 排 、 测 试 所 需 的 环境 和 条 件 、 测 试 培训 安排 等 。 

(2) 编制 测试 大 纲 。 测 试 大 纲 是 测试 的 依据 ， 它 明确 详尽 地 规定 了 在 测试 中 针对 系统 的 每 
一 项 功能 或 特性 所 必须 完成 的 基本 测试 项 目 和 测试 完成 的 标准 。 

(3) 根据 测试 大 纲 设计 和 生成 测试 用 例 , 产生 测试 设计 说 明文 档 , 其 内 容 主 要 有 被 测 项 目 、 
输入 数据 、 测 试 过 程 和 预期 输出 结果 等 。 

(4) 实施 测试 。 测 试 的 实施 阶段 是 由 一 系列 的 测试 周期 组 成 的 。 在 每 个 测试 周期 中 ， 测 试 
人 员 和 开发 人 员 将 依据 预先 编制 好 的 测试 大 纲 和 准备 好 的 测试 用 例 ， 对 被 测 软件 或 设备 进行 完 
整 的 测试 。 

(5) 生成 测试 报告 。 测 试 完成 后 ， 要 形成 相应 的 测试 报告 ， 主 要 对 测试 进行 概要 说 明 ， 列 
出 测试 的 结论 ， 指 出 缺陷 和 错误 。 另 外 ， 给 出 一 些 建议 ， 如 可 采用 的 修改 方法 ， 各 项 修改 预计 
的 工作 量 及 修改 的 负责 人 员 。 


9.4.3 ”测试 策略 和 测试 方法 


1. 软件 测试 策略 


软件 测试 策略 将 软件 测试 用 例 的 设计 方法 集成 到 一 系列 经 过 周密 计划 的 步骤 中 去 ， 从 而 使 
软件 构造 成 功 地 完成 。 测 试 策略 提供 以 下 方面 的 路 径 图 : 描述 将 要 进行 的 测试 步骤 ， 这 些 步骤 
计划 和 执行 的 时 机 ， 需 要 多 少 工作 量 、 时 间 和 资源 。 因 此 ,任何 测试 策略 都 必须 包含 测试 计划 、 
测试 用 例 设计 、 测 试 执行 以 及 结果 数据 的 收集 和 评估 。 
软件 测试 策略 应 该 具有 足够 的 灵活 性 , 以便 促 进 测试 方法 的 定制 。 同时 , 它 必须 足够 严格 ， 
以 便 在 项 目 进行 过 程 中 对 项 目 进行 合理 地 策划 和 追踪 管理 。 

有 效 的 软件 测试 实际 上 分 成 单元 测试 、 集 成 测试 、 确 认 测试 和 系统 测试 4 步 进行 。 

1) 单元 测试 

单元 测试 也 称 为 模块 测试 ， 在 模块 编写 完成 且 无 编译 错误 后 就 可 以 进行 。 单 元 测试 侧重 于 
模块 中 的 内 部 处 理 罗 辑 和 数据 结构 。 如 果 选 用 机 器 测试 ， 一 般 用 白 盒 测试 法 。 这 类 测试 可 以 对 
多 个 模块 同时 进行 。 单 元 测试 主要 检查 模块 的 以 下 5 个 特征 。 

(1) 模块 接口 。 模 块 的 接口 保证 了 测试 模块 的 数据 流 可 以 正确 地 流入 、 流 出 。 在 测试 中 应 
检查 以 下 要 点 。 

@ 测试 模块 的 输入 参数 和 形式 参数 在 个 数 、 属 性 、 单 位 上 是 否 一 致 。 

@ 调用 其 他 模块 时 ， 所 给 出 的 实际 参数 和 被 调用 模块 的 形式 参数 在 个 数 、 属 性 、 单 位 上 
是 否 一 致 。 

@ 调用 标准 函数 时 ， 所 用 的 参数 在 属性 、 数 目 和 顺序 上 是 否 正确 。 

@ 全 局 变量 在 各 模块 中 的 定义 和 用 法 是 否 一 致 。 
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@ 输入 是 否 仅 改变 了 形式 参数 。 

@ 开 / 关 的 语句 是 否 正确 。 

@ 规定 的 IO 格式 是 否 与 输入 输出 语句 一 致 。 

在 使 用 文件 之 前 是 否 已 经 打开 文件 或 使 用 文件 之 后 是 否 已 经 关闭 文件 。 

(2) 局 部 数据 结构 。 在 单元 测试 中 ， 局 部 数据 结构 出 错 是 比较 常见 的 错误 ， 在 测试 时 应 对 
点 考虑 以 下 因素 。 

@ 变量 的 说 明 是 否 合适 。 

@ 是 否 使 用 了 尚未 赋值 或 尚未 初始 化 的 变量 。 

@ 变量 的 初始 值 或 默认 值 是 否 正 确 。 

@ 变量 名 是 否 有 错 〈 例 如 拼写 错 )。 

(3) 重要 的 执行 路 径 。 在 单元 测试 中 ， 对 路 径 的 测试 是 最 基本 的 任务 。 由 于 不 能 进行 穷 举 
测试 ， 需 要 精心 设计 测试 例子 来 发 现 是 否 有 计算 、 比 较 或 控制 流 等 方面 的 错误 。 

@ 计算 方面 的 错误 。 算 术 运算 的 优先 次 序 不 正确 或 理解 错误 ， 精 度 不 够 ， 运 算 对 象 的 类 
型 彼此 不 相 容 ;， 算法 错 ;表达 式 的 符号 表示 不 正确 等 。 

@ 比较 和 控制 流 的 错误 。 本 应 相等 的 量 由 于 精度 造成 不 相等 ， 不 同类 型 进行 比较 ， 风 辑 
运算 符 不 正确 或 优先 次 序 错 误 ， 循环 终止 不 正确 (如 多 循环 一 次 或 少 循环 一 次 )、 死 循环 ， 不 
恰当 地 修改 循环 变量 ， 当 遇 到 分 支 循 环 时 ， 出 口 错误 等 。 

(4) 出 错 处 理 。 好 的 设计 应 该 能 预测 到 出 错 的 条 件 并 且 有 对 出 错 处 理 的 路 径 。 虽 然 计算 机 
可 以 显示 出 错 信息 的 内 容 ， 但 仍 需 要 程序 员 对 出 错 进行 处 理 ， 保 证 其 逻辑 的 正确 性 ， 以 便于 用 
户 维护 。 

(5) 边界 条 件 。 边 界 条 件 的 测试 是 单元 测试 的 最 后 工作 ， 也 是 非常 重要 的 工作 。 软 件 容易 
在 边界 出 现 错误 。 
于 模块 不 是 独立 运行 的 程序 ， 各 模块 之 间 存 在 调用 与 被 调用 的 关系 。 在 对 每 个 模块 进行 
测试 时 ， 需 要 开发 驱动 和 桩 两 种 模块 。 其 中 ， 驱 动 模块 相当 于 一 个 主 程序 ， 接 收 测试 例子 的 数 
据 ， 将 这 些 数 据 送 到 测试 模块 ， 输 出 测试 结果 ;， 桩 模块 也 称 为 存根 模块 。 桩 模块 用 来 代替 测试 
模块 中 所 调用 的 子 模块 ， 其 内 部 可 进行 少量 的 数据 处 理 ， 目 的 是 为 了 检验 入 口 ， 输 出 调用 和 返 
可 的 信息 。 
提高 模块 的 内 聚 度 可 以 简化 单元 测试 。 如 果 每 个 模块 只 完成 一 种 功能 , 对 于 具体 模块 来 讲 ， 
所 需 的 测试 方案 数据 就 会 显著 减少 ， 而 且 更 容易 发 现 和 预测 模块 中 的 错误 。 

对 于 面向 对 象 软件 , 单元 的 概念 发 生 了 变化 。 封装 导出 了 类 的 定义 。 每 个 类 和 类 的 实例 (对 
象 ) 包装 有 属性 〈 数 据 ) 和 处 理 这 些 数据 的 操作 〔〈 函 数 或 方法 )。 封 装 的 类 常 是 单元 测试 的 重 
点 ， 然 而 ， 类 中 包含 的 操作 是 最 小 的 可 测试 单元 。 由 于 类 中 可 以 包含 一 些 不 同 的 操作 ， 且 特殊 
的 操作 可 以 作为 不 同 的 类 的 一 部 分 存在 ， 因 此 ， 面 向 对 象 软件 的 类 测试 是 由 封装 在 该 类 中 的 操 
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作 和 类 


的 状态 行为 驱动 的 。 


2) 集成 测试 

集成 测试 就 是 把 模块 按 系 统 设计 说 明 书 的 要 求 组 合 起 来 进行 测试 。 即 使 所 有 模块 都 通过 了 
测试 ， 但 在 集成 之 后 ， 仍 可 能 会 出 现 问题 : 穿 过 模块 的 数据 丢失 ， 一 个 模块 的 功能 对 其 他 模块 
造成 有 害 的 影响 ， 各 个 模块 集成 起 来 没有 达到 预期 的 功能 ;全 局 数据 结构 出 现 问题 。 另 外 ， 单 
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的 误差 可 以 接受 ， 但 模块 组 合 后 ， 可 能 会 出 现 误差 累积 ， 最 后 到 不 能 接受 的 程度 ， 所 以 
成 测试 。 
常 集成 测试 有 两 种 方法 : 一 种 是 分 别 测试 各 个 模块 ， 再 把 这 些 模块 组 合 起 来 进行 整体 测 
非 增 量 式 集成 ， 另 一 种 是 把 下 一 个 要 测试 的 模块 组 合 到 已 测试 好 的 模块 中 ， 测 试 完 后 再 
个 需要 测试 的 模块 组 合 起 来 进行 测试 ， 逐 步 把 所 有 模块 组 合 在 一 起 ， 并 完成 测试 ， 如 自 
集成 、 自 底 向 上 集成 ， 即 增 量 式 集成 。 非 增 量 式 集成 可 以 对 模块 进行 并 行 测试 ， 能 充分 
力 ， 并 加 快 工程 进度 。 但 这 种 方法 容易 混乱 ， 出 现 错误 不 容易 查找 和 定位 。 增 量 式 测试 
逐步 扩大 ， 错 误 容易 定位 ， 而 且 已 测试 的 模块 可 在 新 的 条 件 下 再 测试 ， 测 试 更 彻底 。 

向 对 象 软 件 没有 明显 的 层次 控制 结构 ， 类 的 成 分 间 的 直接 或 间接 相互 作用 ， 使 得 每 次 将 
作 集 成 到 类 中 往往 不 可 能 。 因 此 ， 面 向 对 象 系统 的 集成 有 两 种 不 同 的 策略 : 一 是 基于 线 
试 ， 集 成 响应 系统 的 一 个 输入 或 事件 所 需 的 一 组 类 ， 每 个 线程 单独 地 集成 和 测试 ， 另 一 
是 基于 使 用 的 测试 ， 通 过 测试 很 少 使 用 服务 类 的 那些 类 〈 称 为 独立 类 ) 开始 构建 系统 ， 
测试 完 后 ， 利 用 独立 类 测试 下 一 层 的 类 〈 称 为 依赖 类 )。 继 续 依赖 类 的 测试 直到 完成 整 


确认 测试 
过 集成 测试 之 后 ， 软 件 就 被 集成 起 来 ， 接 口 方面 的 问题 已 经 解决 ， 将 进入 软件 测试 的 最 
环节 ， 即 确认 测试 。 确 认 测 试 的 任务 就 是 进一步 检查 软件 的 功能 和 性 能 是 否 与 用 户 要 求 
系统 方案 说 明 书 描述 了 用 户 对 软件 的 要 求 ， 所 以 是 软件 有 效 性 验证 的 标准 ， 也 是 确认 
基础 。 
认 测 试 ， 首 先 要 进行 有 效 性 测试 以 及 软件 配置 审查 ， 然 后 进行 验收 测试 和 安装 测试 ， 经 
部 门 的 认可 和 专家 的 鉴定 后 ， 软 件 即 可 以 交 给 用 户 使 用 。 

) 有 效 性 测试 。 就 是 在 模拟 环境 下 ， 通 过 黑 盒 测试 检验 所 开发 的 软件 是 否 与 需求 规格 说 
致 。 在 设计 测试 例子 时 ， 除 了 检测 软件 的 功能 和 性 能 之 外 ， 还 需要 对 软件 的 容错 性 、 维 
其 他 方面 进行 检测 。 测 试 人 员 可 由 开发 商 的 内 部 人 员 组 成 ， 但 最 好 是 没有 参加 该 项 目的 
的 软件 设计 人 员 。 在 所 有 测试 例子 完成 之 后 ， 若 发 现 测试 结果 与 预期 的 不 符 ， 这 时 要 列 
清单 。 在 这 个 阶段 才 发 现 的 严重 错误 ,一般 很 难 在 预定 的 时 间 内 纠正 , 需要 与 用 户 协商 ， 
善 解决 问题 的 办 法 。 


(2) 软件 配置 审查 。 主 要 是 检查 软件 〈 源 程序 、 目 标 程序 ) 和 文档 (包括 面向 开发 和 用 户 
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的 文档 ) 以 及 数据 〈 程 序 内 部 的 数据 或 程序 外 部 的 数据 ) 是 否 齐 全 ,分 类 是 否 有 序 。 确 保 文档 、 
资料 的 正确 和 完善 ， 以 便 维 护 阶段 使 用 。 

(3) 验收 测试 。 是 以 用 户 为 主 的 测试 。 软 件 开 发 人 员 和 质量 保证 人 员 也 应 该 参加 。 在 验收 
测试 之 前 ， 需 要 对 用 户 进行 培训 ， 以 便 熟 悉 该 系统 。 验 收 测试 的 测试 例子 由 用 户 参与 设计 ， 主 
要 验证 软件 的 功能 、 性 能 、 可 移植 性 、 兼 容 性 和 容错 性 等 ， 测 试 时 一 般 采 用 实际 数据 。 多 数 软 
件 开 发 者 使 用 a 测试 与 8 测试 的 过 程 ， 其 中 a 测试 是 最 终 用 户 在 开发 者 的 场所 进行 ， 而 B 测试 
是 在 最 终 用 户 场所 执行 。 

4) 系统 测试 

系统 测试 是 将 已 经 确认 的 软件 、 计 算 机 硬件 、 外 设 和 网 络 等 其 他 因素 结合 在 一 起 ， 进 行 信 
息 系统 的 各 种 集成 测试 和 确认 测试 ， 其 目的 是 通过 与 系统 的 需求 相 比较 ， 发 现 所 开发 的 系统 与 
用 户 需求 不 符 或 矛盾 的 地 方 。 系 统 测试 是 根据 系统 方案 说 明 书 来 设计 测试 用 例 的 ， 常 见 的 系统 
测试 主要 有 以 下 内 容 。 

(1) 恢复 测试 。 监 测 系统 的 容错 能 力 。 检 测 方法 是 采用 各 种 方法 让 系统 出 现 故障 ， 检 验 系 
统 是 否 按照 要 求 能 从 故障 中 恢复 过 来 ， 并 在 约定 的 时 间 内 开始 事务 处 理 ， 而 且 不 对 系统 造成 任 
何 伤害 。 如 果 系 统 的 恢复 是 自动 的 〈 由 系统 自动 完成 )， 需 要 验证 重新 初始 化 、 检 查 点 和 数据 
恢复 等 是 否 正 确 。 如 果 恢 复 需要 人 工 干预 ， 就 要 对 恢复 的 平均 时 间 进 行 评估 并 判断 它 是 否 在 允 
许 的 范围 内 。 
(2) 安全 性 测试 。 检 测 系统 的 安全 机 制 、 保 密 措施 是 否 完善 ， 主 要 是 为 了 检验 系统 的 防范 
能 力 。 测 试 的 方法 是 测试 人 员 模 拟 非法 入 侵 者 ， 采 用 各 种 方法 冲破 防线 。 系 统 安全 性 设计 准则 
是 使 非法 入 侵 者 所 花费 的 代价 比 进入 系统 后 所 得 到 的 好 处 要 大 ， 此 时 非法 入 侵 已 无 利 可 图 。 

(3) 压力 测试 。 也 称 为 强度 测试 ， 是 对 系统 在 异常 情况 下 的 承受 能 力 的 测试 ， 是 检查 系统 
在 极限 状态 下 运行 时 ， 性 能 下 降 的 幅度 是 否 在 允许 的 范围 内 。 因 此 ， 压 力 测试 要 求 系统 在 非 正 
常数 量 、 频 率 或 容量 的 情况 下 运行 。 压 力 测试 主要 是 为 了 发 现在 有 效 的 输入 数据 中 可 能 引起 不 
稳定 或 不 正确 的 数据 组 合 。 例 如 ， 运 行使 系统 处 理 超过 设计 能 力 的 最 大 允许 值 的 测试 例子 ， 使 
系统 传输 超过 设计 最 大 能 力 的 数据 ， 包 括 内 存 的 写 入 和 读 出 等 。 

(4) 性 能 测试 。 检 查 系 统 是 否 满足 系统 设计 方案 说 明 书 对 性 能 的 要 求 。 性 能 测试 覆盖 了 软 
件 测试 的 各 阶段 ， 而 不 是 等 到 系统 的 各 部 分 都 集成 之 后 ， 才 确定 系统 的 真正 性 能 。 通 常 与 强度 
测试 结合 起 来 进行 ， 并 同时 对 软件 、 硬 件 进 行 测试 。 软 件 方面 主要 从 响应 时 间 、 处 理 速 度 、 知 
吐 量 和 处 理 精度 等 方面 来 检测 。 

(5) 可 靠 性 、 可 用 性 和 可 维护 性 测试 。 通常 使 用 以 下 两 个 指标 来 进行 衡量 : 平均 失效 间隔 
时 间 (Mean Time Between Failures, MTBF) 是 否 超过 了 规定 的 时 限 ， 因 故障 而 停机 时 间 (Mean 
Time To Repairs，MTTR) 在 一 年 中 不 应 超过 多 少时 间 。 

(6) 安装 测试 。 在 安装 软件 系统 时 ， 会 有 多 种 选择 。 安 装 测试 就 是 为 了 检测 在 安装 过 程 中 
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是 否 有 误 、 是 否 容易 操作 等 。 主 要 监测 系统 的 每 一 个 部 分 是 否 齐全 ， 硬 件 的 配置 是 否 合理 ， 
装 中 需要 产生 的 文件 和 数据 库 是 否 已 产生 ， 其 内 容 是 否 正确 等 。 


2， 测 试 方法 


测试 是 可 以 事先 计划 并 可 以 系统 地 进行 的 一 系列 活动 。 因 此 ， 应 该 为 软件 过 程 定义 软件 测 
试 模板 ， 即 将 特定 的 测试 方法 和 测试 用 例 设 计 放 在 一 系列 的 测试 步骤 中 去 。 

软件 测试 方法 分 为 静态 测试 和 动态 测试 。 

(1) 静态 测试 。 静 态 测试 是 指 被 测试 程序 不 在 机 器 上 运行 ， 而 是 采用 人 工 检测 和 计算 机 辅 
助 静态 分 析 的 手段 对 程序 进行 检测 。 

Q@ 人 工 检测 。 人 工 检测 是 不 依靠 计算 机 而 是 靠 人 工 审查 程序 或 评审 软件 ， 包 括 代码 检查 、 
静态 结构 分 析 和 代码 质量 度量 等 。 

@ 计算 机 辅助 静态 分 析 。 利 用 静态 分 析 工 具 对 被 测试 程序 进行 特性 分 析 ， 从 程序 中 提取 
一 些 信息 ， 以 便 检查 程序 逻辑 的 各 种 缺陷 和 可 疑 的 程序 构造 。 

(2) 动态 测试 。 动 态 测试 是 指 通过 运行 程序 发 现 错误 。 对 软件 产品 进行 动态 测试 时 可 以 采 
用 黑 盒 测 试 法 和 白 盒 测 试 法 。 测 试用 例 由 测试 输入 数据 和 与 之 对 应 的 预期 输出 结构 组 成 。 在 设 
计 测试 用 例 时 ， 应 当 包括 合理 的 输入 条 件 和 不 合理 的 输入 条 件 。 

1) 用 黑 盒 法 设计 测试 用 例 

黑 盒 测试 也 称 为 功能 测试 ， 在 完全 不 考虑 软件 的 内 部 结构 和 特性 的 情况 下 ， 测 试 软件 的 外 
部 特性 。 进 行 黑 盒 测 试 主要 是 为 了 发 现 以 下 几 类 错误 。 

(1) 是 否 有 错误 的 功能 或 遗漏 的 功能 ? 

(2) 界面 是 否 有 误 ? 输入 是 否 正 确 接收 ? 输出 是 否 正确 ? 

(3) 是 否 有 数据 结构 或 外 部 数据 库 访问 错误 ? 

(4) 性 能 是 否 能 够 接受 ? 

(5) 是 否 有 初始 化 或 终止 性 错误 ? 

常用 的 黑 盒 测试 技术 有 等 价 类 划分 、 边 值 分 析 、 错 误 猜 测 和 因果 图 等 。 

(1) 等 价 类 划分 。 等 价 类 划分 法 将 程序 的 输入 域 划分 为 若干 等 价 类 ， 然 后 从 每 个 等 价 类 中 
选取 一 个 代表 性 数据 作为 测试 用 例 。 每 一 类 的 代表 性 数据 在 测试 中 的 作用 等 价 于 这 一 类 中 的 其 
他 值 。 这 样 就 可 以 用 少量 代表 性 的 测试 用 例 取 得 较 好 的 测试 效果 。 等 价 类 划分 有 两 种 不 同 的 情 
况 : 有 效 等 价 类 和 无 效 等 价 类 。 在 设计 测试 用 例 时 ， 要 同时 考虑 这 两 种 等 价 类 。 

定义 等 价 类 的 原则 如 下 。 

@ 在 输入 条 件 规定 了 取 值 范围 或 值 的 个 数 的 情况 下 ， 可 以 定义 一 个 有 效 等 价 类 和 两 个 无 
效 等 价 类 。 

@ 在 输入 条 件 规定 了 输入 值 的 集合 或 规定 了 “必须 如 何 ” 的 条 件 的 情况 下 ， 可 以 定义 一 
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个 有 效 等 价 类 和 一 个 无 效 等 价 类 。 

@ 在 输入 条 件 是 一 个 布尔 量 的 情况 下 ， 可 以 定义 一 个 有 效 等 价 类 和 一 个 无 效 等 价 类 。 

@ 在 规定 了 输入 数据 的 一 组 值 ( 假 定 个)， 并 且 程 序 要 对 每 一 个 输入 值 分 别处 理 的 情况 
下 ， 可 以 定义 个 有 效 等 价 类 和 一 个 无 效 等 价 类 。 

@ 在 规定 了 输入 数据 必须 遵守 的 规则 的 情况 下 ， 可 定义 一 个 有 效 等 价 类 符合 规则 〉 和 
若干 个 无 效 等 价 类 从 不 同 角度 违反 规则 )。 

@ 在 确 知已 划分 的 等 价 类 中 ， 各 元 素 在 程序 处 理 中 的 方式 不 同 的 情况 下 ， 则 应 再 将 该 等 
价 类 进一步 地 划分 为 更 小 的 等 价 类 。 

定义 好 等 价 类 之 后 ， 建 立 等 价 类 表 ， 并 为 每 个 等 价 类 编号 。 在 设计 一 个 新 的 测试 用 例 时 ， 
使 其 尽 可 能 多 地 覆盖 尚未 覆盖 的 有 效 等 价 类 ， 不 断 重复 ， 最 后 使 得 所 有 有 效 等 价 类 均 被 测试 用 
例 所 覆盖 。 然 后 设计 一 个 新 的 测试 用 例 ， 使 其 只 覆盖 一 个 无 效 等 价 类 。 

(2) 边界 值 划分 。 输 入 的 边界 比 中 间 更 加 容易 发 生 错误 ， 因 此 用 边界 值 分 析 来 补充 等 价 类 
划分 的 测试 用 例 设计 技术 。 边 界 值 划分 选择 等 价 类 边界 的 测试 用 例 ， 既 注重 于 输入 条 件 边 界 ， 
又 适用 于 输出 域 测试 用 例 。 

对 边界 值 设计 测试 用 例 应 遵循 的 原则 如 下 。 
Q@ 如 果 输 入 条 件 规定 了 值 的 范围 ， 则 应 取 刚 达到 这 个 范围 的 边界 的 值 ， 以 及 刚刚 超越 这 
个 范围 边界 的 值 作为 测试 输入 数据 。 

@ 如 果 输 入 条 件 规定 了 值 的 个 数 ， 则 用 最 大 个 数 、 最 小 个 数 、 比 最 小 个 数 少 1、 比 最 大 个 
数 多 1 的 数据 作为 测试 数据 。 

@ 根据 规格 说 明 的 每 个 输出 条 件 ， 使 用 上 述 两 条 原则 。 

@ 如 果 程 序 的 规格 说 明 给 出 的 输入 域 或 输出 域 是 有 序 集合 ， 则 应 选取 集合 的 第 一 个 元 素 
和 最 后 一 个 元 素 作为 测试 用 例 。 

@ 如 果 程 序 中 使 用 了 一 个 内 部 数据 结构 ， 则 应 当选 择 这 个 内 部 数据 结构 边界 上 的 值 作为 
测试 用 例 。 

@ 分 析 规 格 说 明 ， 找 出 其 他 可 能 的 边界 条 件 。 

(3) 错误 推测 。 错 误 推测 是 基于 经 验 和 直觉 推测 程序 中 所 有 可 能 存在 的 各 种 错误 ， 从 而 有 
针对 性 地 设计 测试 用 例 的 方法 。 其 基本 思想 是 列举 出 程序 中 所 有 可 能 有 的 错误 和 容易 发 生 错 误 
的 特殊 情况 ， 根 据 它们 选择 测试 用 例 。 

(4) 因果 图 。 因 果 图 法 是 从 自然 语言 描述 的 程序 规格 说 明 中 找 出 因 〈 输 入 条 件 ) 和 果 〈 输 
出 或 程序 状态 的 改变 )， 通 过 因果 图 转换 为 判定 表 。 

利用 因果 图 导出 测试 用 例 需 要 经 过 以 下 几 个 步骤 。 

@ 分 析 程序 规格 说 明 的 描述 中 ， 哪 些 是 原因 ， 哪 些 是 结果 。 原 因 常 常 是 输入 条 件 或 是 输 
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入 条 件 的 等 价 类 ， 而 结果 是 输出 条 件 。 

@ 分 析 程 序 规格 说 明 的 描述 中 语义 的 内 容 , 并 将 其 表示 成 连接 各 个 原因 与 各 个 结果 的 “ 
果 图 ”。 

@ 标明 约束 条 件 。 由 于 语法 或 环境 的 限制 ， 有 些 原因 和 结果 的 组 合 情 况 是 不 可 能 出 现 的 。 
为 表明 这 些 特定 的 情况 ， 在 因果 图 上 使 用 若干 个 标准 的 符号 标明 约束 条 件 。 

@ 把 因果 图 转换 成 判定 表 。 

@ 为 判定 表 中 每 一 列表 示 的 情况 设计 测试 用 例 。 

这 样 生 成 的 测试 用 例 〈 局 部 ， 组 合 关系 下 的 ) 包括 了 所 有 输入 数据 的 取 “ 真 ”和 取 “ 假 ” 
的 情况 ， 构 成 的 测试 用 例 数据 达到 最 少 ， 且 测试 用 例 数 据 随 输入 数据 数目 的 增加 而 增加 。 

2) 用 和 白 盒 法 设计 测试 用 例 

白 盒 测 试 也 称 为 结构 测试 ， 根 据 程序 的 内 部 结构 和 逻辑 来 设计 测试 用 例 ， 对 程序 的 路 径 和 
过 程 进行 测试 ， 检 查 是 否 满足 设计 的 需要 。 

白 盒 测 试 常用 的 技术 是 逻辑 覆盖 、 循 环 覆 盖 和 基本 路 径 测试 。 

(1) 逻辑 覆盖 。 罗 辑 履 盖 考 察 用 测试 数据 运行 被 测 程序 时 对 程序 逻辑 的 覆盖 程度 。 主 要 的 
逻辑 覆盖 标准 有 语句 覆盖 、 判 定 覆 盖 、 条 件 覆 盖 、 判 定 /条 件 覆 盖 、 条 件 组 合 覆 盖 和 路 径 镍 
盖 6 种 。 

Q 语句 覆盖 。 语 名 覆盖 是 指 选择 足够 的 测试 数据 ， 使 被 测试 程序 中 每 条 语句 至 少 执行 一 
次 。 语 句 槛 盖 对 程序 执行 逻辑 的 覆盖 很 低 ， 因 此 一 般 认 为 它 是 很 弱 的 逻辑 覆盖 。 

@ 判定 覆盖 。 判 定 覆 盖 是 指 设计 足够 的 测试 用 例 ， 使 得 被 测 程序 中 每 个 判定 表达 式 至 少 
获得 一 次 “ 真 ” 值 和 “ 假 ” 值 ， 或 者 说 是 程序 中 的 每 一 个 取 “ 真 ”分 支 和 取 “ 假 ”分 支 至 少 都 
通过 一 次 ， 因 此 判定 覆盖 也 称 为 分 支 覆盖 。 判 定 覆 盖 要 比 语句 覆盖 更 强 一 些 。 

@ 条 件 覆 盖 。 条 件 履 盖 是 指 构造 一 组 测试 用 例 ， 使 得 每 一 判定 语句 中 每 个 逻辑 条 件 的 各 
种 可 能 的 值 至 少 满足 一 次 。 

@ 判定 /条 件 覆 盖 。 判 定 /条 件 覆 盖 是 指 设计 足够 的 测试 用 例 ， 使 得 判定 中 每 个 条 件 的 所 有 
可 能 取 值 〈 真 / 假 ) 至 少 出 现 一 次 ， 并 使 每 个 判定 本 身 的 判定 结果 《〈 真 / 假 ) 也 至 少 出 现 一 次 。 

@@ 条 件 组 合 覆 盖 。 条 件 组 合 覆盖 是 指 设计 足够 的 测试 用 例 ， 使 得 每 个 判定 中 条 件 的 各 种 
可 能 值 的 组 合 都 至 少 出 现 一 次 。 满 足 条 件 组 合 覆 盖 的 测试 用 例 是 一 定 满足 判定 覆盖 、 条 件 履 盖 
和 判定 /条 件 履 盖 的 。 

@ 路 径 覆 盖 。 路 径 覆 盖 是 指 履 盖 被 测试 程序 中 所 有 可 能 的 路 径 。 

(2) 循环 覆盖 。 执 行 足够 的 测试 用 例 ， 使 得 循环 中 的 每 个 条 件 都 得 到 验证 。 

(3) 基本 路 径 测试 。 基 本 路 径 测试 法 是 在 程序 控制 流 图 的 基础 上 ， 通 过 分 析 控 制 流 图 的 环 
路 复杂 性 ， 导 出 基本 可 执行 路 径 集合 ， 从 而 设计 测试 用 例 。 设 计 出 的 测试 用 例 要 保证 在 测试 中 
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程序 的 每 一 条 独立 路 径 都 执行 过 ， 即 程序 中 的 每 条 可 执行 语句 至 少 执行 一 次 。 此 外 ， 所 有 条 件 
语句 的 真 值 状态 和 假 值 状 态 都 测试 过 。 WERE 
点 代表 包含 一 个 或 多 个 无 分 支 的 语句 序列 ， 边 代表 控制 流 。 

白 盒 测 试 的 原则 如 下 。 

(1) 程序 模块 中 的 所 有 独立 路 径 至 少 执行 一 次 。 

(2) 在 所 有 的 逻辑 判断 中 ， 取 “ 真 ”和 取 “ 假 ”的 两 种 情况 至 少 都 能 执行 一 次 。 

(3) 每 个 循环 都 应 在 边界 条 件 和 一 般 条 件 下 各 执行 一 次 。 

(4) 测试 程序 内 部 数据 结构 的 有 效 性 等 。 


9.4.4 ”系统 转换 


在 进行 新 旧 系 统 转 换 以 前 ， 首 先 要 进行 新 系统 的 试 运行 。 在 系统 测试 、 调 试 中 ， 使 用 的 是 
系统 测试 数据 ， 有 些 实际 运行 中 可 能 出 现 的 问题 ， 很 难 通过 这 些 数 据 被 发 现 。 所 以 ， 一 个 系统 
开发 后 ， 让 它 实际 运行 一 段 时 间 ， 是 对 系统 最 好 的 检验 和 测试 方法 。 

系统 试 运行 阶段 的 主要 工作 如 下 。 

(1) 对 系统 进行 初始 化 、 输 入 各 种 原始 数据 记录 。 

(2) 记录 系统 运行 的 数据 和 状况 。 

(3) 核对 新 系统 输出 和 旧 系 统 〈 人 工 或 计算 机 系统 )》 输出 的 结果 

(4) 对 实际 系统 的 输入 方式 进行 考察 (是 否 方便 、 效 率 如 何 、 安 全 可 靠 性 、 误 操作 保护 等 )。 

(5) 对 系统 实际 运行 、 响 应 速度 〈 包 括 运算 速度 、 传 递 速度 、 查 询 速度 和 输出 速度 等 ) 进 
行 实际 测试 。 

新 系统 试 运行 成 功 之 后 ， 就 可 以 在 新 系统 和 旧 系 统 之 间 互 相 转 换 。 新 旧 系 统 之 间 的 转换 方 
式 有 直接 转换 、 并 行 转换 和 分 段 转换 。 

(1) 直接 转换 。 直 接 转换 就 是 在 确定 新 系统 运行 无 误 时 ， 立 刻 启用 新 系统 ， 终 止 旧 系统 运 
行 。 这 种 方式 对 人 员 、 设 备 费用 很 节省 。 这 种 方式 一 般 适 用 于 一 些 处 理 过 程 不 太 复杂 ， 数 据 不 
很 重要 的 场合 。 

(2) 并 行 转换 。 这 种 转换 方式 是 新 旧 系统 并 行 工 作 一 段 时 间 ， 经 过 一 段 时 间 的 考验 以 后 ， 
新 系统 正式 替代 旧 系 统 。 对 于 较 复杂 的 大 型 系统 ， 它 提供 了 一 个 与 旧 系统 运行 结果 进行 比较 的 
会 ， 可 以 对 新 旧 两 个 系统 的 时 间 要 求 、 出 错 次 数 和 工作 效率 给 以 公正 的 评价 。 当 然 ， 由 于 与 
日 系统 并 行 工作 ， 消 除了 尚未 认识 新 系统 之 前 的 紧张 和 不 安 。 在 银行 、 财 务 和 一 些 企 业 的 核心 
系统 中 ,这 是 一 种 经 常 使 用 的 转换 方式 。 它 的 主要 特点 是 安全 、 可 靠 ， 但 费用 和 工作 量 都 很 大 ， 
因为 在 相当 长 时 间 内 系统 要 两 套 班 子 并 行 工作 。 

(3) 分 段 转换 。 分 段 转换 又 称 逐 步 转换 、 向 导 转 换 、 试 点 过 渡 法 等 。 这 种 转换 方式 实际 上 
是 以 上 两 种 转换 方式 的 结合 。 在 新 系统 全 部 正式 运行 前 ， 一 部 分 一 部 分 地 代替 旧 系统 。 那 些 在 
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转换 过 程 中 还 没有 正式 运行 的 部 分 ， 可 以 在 一 个 模拟 环境 中 继续 试 运行 。 这 种 方式 既 保证 了 可 
靠 性 ， 又 不 至 于 费用 太 大 。 但 是 ， 这 种 分 段 转换 要 求 子 系统 之 间 有 一 定 的 独立 性 ， 对 系统 的 设 
计 和 实现 都 有 一 定 的 要 求 ， 否 则 就 无 法 实现 这 种 分 段 转换 的 设想 。 


9.5 ”系统 运行 与 维护 基础 知识 


9.5.1 “系统 维护 概述 


软件 维护 是 软件 生命 周期 中 的 最 后 一 个 阶段 ， 处 于 系统 投入 生产 性 运行 以 后 的 时 期 中 ， 因 
此 不 属于 系统 开发 过 程 。 软 件 维护 是 在 软件 已 经 交付 使 用 之 后 ， 为 了 改正 错误 或 满足 新 的 需求 
而 修改 软件 的 过 程 ， 即 软件 在 交付 使 用 后 对 软件 所 做 的 一 切 改动 。 


1， 系 统 可 维护 性 概念 


系统 的 可 维护 性 可 以 定性 地 定义 为 : 维护 人 员 理解 、 改 正 、 改 动 和 改进 这 个 软件 的 难 易 程 
度 。 提 高 可 维护 性 是 开发 软件 系统 所 有 步骤 的 关键 目的 ， 系 统 是 否 能 被 很 好 地 维护 ， 可 用 系统 
的 可 维护 性 这 一 指标 来 衡量 。 

1) 系统 的 可 维护 性 的 评价 指标 

(1) 可 理解 性 。 指 别人 能 理解 系统 的 结构 、 界 面 、 功 能 和 内 部 过 程 的 难 易 程度 。 模 块 化 、 
详细 设计 文档 、 结 构 化 设计 和 良好 的 高 级 程序 设计 语言 等 ， 都 有 助 于 提高 可 理解 性 。 

(2) 可 测试 性 。 诊 断 和 测试 的 容易 程度 取决 于 易 理解 的 程度 。 好 的 文档 资料 有 利于 诊断 和 
测试 ， 同 时 ， 程 序 的 结构 、 高 性 能 的 测试 工具 以 及 周密 计划 的 测试 工序 也 是 至 关 重 要 的 。 为 此 ， 
开发 人 员 在 系统 设计 和 编程 阶段 就 应 尽力 把 程序 设计 成 易 诊断 和 测试 的 。 此 外 , 在 系统 维护 时 ， 
应 该 充分 利用 在 系统 测试 阶段 保存 下 来 的 测试 用 例 。 

(3) 可 修改 性 。 诊 断 和 测试 的 容易 程度 与 系统 设计 所 制定 的 设计 原则 有 直接 关系 。 模 块 的 
耦合 、 内 聚 、 作 用 范围 与 控制 范围 的 关系 等 ， 都 对 可 修改 性 有 影响 。 

2) 维护 与 软件 文档 

文档 是 软件 可 维护 性 的 决定 因素 。 由 于 长 期 使 用 的 大 型 软件 系统 在 使 用 过 程 中 必然 会 经 受 
多 次 修改 ， 所 以 文档 显得 非常 重要 。 

软件 系统 的 文档 可 以 分 为 用 户 文档 和 系统 文档 两 类 。 用 户 文档 主要 描述 系统 功能 和 使 用 方 
法 ， 并 不 关心 这 些 功能 是 怎样 实现 的 ， 系 统 文档 描述 系统 设计 、 实 现 和 测试 等 各 方面 的 内 容 。 
可 维护 性 是 所 有 软件 都 应 具有 的 基本 特点 ， 必 须 在 开发 阶段 保证 软件 具有 可 维护 的 特点 。 
在 软件 工程 的 每 一 个 阶段 都 应 考虑 并 提高 软件 的 可 维护 性 ， 在 每 个 阶段 结束 前 的 技术 审查 和 管 
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理 复 查 中 ， 应 该 着 重 对 可 维护 性 进行 复审 。 

在 系统 分 析 阶 段 的 复审 过 程 中 ， 应 该 对 将 来 要 改进 的 部 分 和 可 能 会 修改 的 部 分 加 以 注解 并 
指明 ， 并 且 指 出 软件 的 可 移植 性 问题 以 及 可 能 影响 软件 维护 的 系统 界面 ， 在 系统 设计 阶段 的 复 
审 期 间 ， 应 该 从 容易 修改 、 模 块 化 和 功能 独立 的 目的 出 发 ， 评 价 软 件 的 结构 和 过 程 ， 在 系统 实 
施 阶 段 的 复审 期 间 ， 代 码 复审 应 该 强调 编码 风格 和 内 部 说 明文 档 这 两 个 影响 可 维护 性 的 因素 。 
在 完成 了 每 项 维护 工作 之 后 ， 都 应 该 对 软件 维护 本 身 进 行 认真 的 复审 。 

3) 软件 文档 的 修改 

维护 应 该 针对 整个 软件 配置 ， 不 应 该 只 修改 源 程序 代码 。 如 果 对 源 程序 代码 的 修改 没有 反 
映 在 设计 文档 或 用 户 手册 中 ， 可 能 会 产生 严重 的 后 果 。 每 当 对 数据 、 软 件 结构 、 模 块 过 程 或 任 
何其 他 有 关 的 软件 特点 做 了 改动 时 ， 必 须 立 即 修改 相应 的 技术 文档 。 不 能 准确 反映 软件 当前 状 
态 的 设计 文档 可 能 比 完全 没有 文档 更 坏 。 在 以 后 的 维护 工作 中 很 可 能 因 文 档 不 完全 符合 实际 而 
不 能 正确 理解 软件 ， 从 而 在 维护 中 引入 过 多 的 错误 。 


2， 系 统 维护 的 内 容 及 类 型 


系统 维护 主要 包括 硬件 设备 的 维护 、 应 用 软件 的 维护 和 数据 的 维护 。 

1) 硬件 维护 

硬件 的 维护 应 由 专职 的 硬件 维护 人 员 来 负责 ， 主 要 有 两 种 类 型 的 维护 活动 : 一 种 是 定期 的 
设备 保养 性 维护 ， 保 养 周 期 可 以 是 一 周 或 一 个 月 不 等 ， 维 护 的 主要 内 容 是 进行 例 行 的 设备 检查 
与 保养 ， 易 耗 品 的 更 换 与 安装 等 ， 另 一 种 是 突 发 性 的 故障 维护 ， 即 当 设备 出 现 突 发 性 故障 时 ， 
专职 的 维修 人 员 或 请 厂 方 的 技术 人 员 来 排除 故障 ， 这 种 维修 活动 所 花 时 间 不 能 过 长 ， 以 免 影 
响 系 统 的 正常 运行 。 

2) 软件 维护 

软件 维护 主要 是 指 根据 需求 变化 或 硬件 环境 的 变化 对 应 用 程序 进行 部 分 或 全 部 的 修改 。 修 
改 时 应 充分 利用 源 程序 ， 修 改 后 要 填写 程序 修改 登记 表 ， 并 在 程序 变更 通知 书 上 写 明 新 旧 程 序 
的 不 同 之 处 。 

软件 维护 的 内 容 一 般 有 以 下 几 个 方面 。 

(1) 正确 性 维护 。 是 指 改 正在 系统 开发 阶段 已 发 生 而 系统 测试 阶段 尚未 发 现 的 错误 。 这 方 
面 的 维护 工作 量 要 占 整 个 维护 工作 量 的 17% 一 21%。 所 发 现 的 错误 有 的 不 太 重 要 ， 不 影响 系统 
的 正常 运行 ， 其 维护 工作 可 随时 进行 ， 而 有 的 错误 非常 重要 ， 甚 至 影响 整个 系统 的 正常 运行 ， 
其 维护 工作 必须 制定 计划 ， 进 行 修改 ， 并 且 要 进行 复查 和 控制 。 

(2) 适应 性 维护 。 是 指使 应 用 软件 适应 信息 技术 变化 和 管理 需求 变化 而 进行 的 修改 。 这 方 
看 的 维护 工作 量 占 整 个 维护 工作 量 的 18% 一 25%。 由 于 目前 计算 机 硬件 价格 的 不 断 下 降 ， 各 类 
系统 软件 层出不穷 ， 人 们 常常 为 改善 系统 硬件 环境 和 运行 环境 而 产生 系统 更 新 换代 的 需求 ; 企 
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业 的 外 部 市 场 环境 和 管理 需求 的 不 断 变化 也 使 得 各 级 管理 人 员 不 断 提出 新 的 信息 需求 。 这 些 因 
素 都 将 导致 适应 性 维护 工作 的 产生 。 进 行 这 方面 的 维护 工作 也 要 像 系 统 开发 一 样 ， 有 计划 、 有 
步骤 地 进行 。 

(3) 完善 性 维护 。 这 是 为 扩充 功能 和 改善 性 能 而 进行 的 修改 ， 主 要 是 指 对 已 有 的 软件 系统 
增加 一 些 在 系统 分 析 和 设计 阶段 中 没有 规定 的 功能 与 性 能 特征 。 这 些 功 能 对 完善 系统 功能 是 非 
常 必要 的 。 另 外 , 还 包括 对 处 理 效率 和 编写 程序 的 改进 , 这 方面 的 维护 占 整 个 维护 工作 的 50% 一 
60%， 比 重 较 大 ， 也 是 关系 到 系统 开发 质量 的 重要 方面 。 这 方面 的 维护 除了 要 有 计划 、 有 步骤 
地 完成 外 ， 还 要 注意 将 相关 的 文档 资料 加 入 到 前 面相 应 的 文档 中 去 。 

(4) 预防 性 维护 。 为 了 改进 应 用 软件 的 可 靠 性 和 可 维护 性 ， 为 了 适应 未 来 的 软 硬 件 环境 的 
变化 ， 应 主动 增加 预防 性 的 新 的 功能 ， 以 使 应 用 系统 适应 各 类 变化 而 不 被 淘汰 。 例 如 将 专用 报 
表 功 能 改 成 通用 报表 生成 功能 ， 以 适应 将 来 报表 格式 的 变化 。 这 方面 的 维护 工作 量 占 整个 维护 
工作 量 的 4% 左 右 。 

3) 数据 维护 

数据 维护 工作 主要 是 由 数据 库 管理 员 来 负责 ， 主 要 负责 数据 库 的 安全 性 和 完整 性 以 及 进行 
并 发 性 控制 。 数 据 库 管理 员 还 要 负责 维护 数据 库 中 的 数据 ， 当 数据 库 中 的 数据 类 型 、 长 度 等 发 
生变 化 时 ， 或 者 需要 添加 某 个 数据 项 、 数 据 库 时 ， 要 负责 修改 相关 的 数据 库 、 数 据 字 典 ， 并 通 
知 有 关 人 员 。 另 外 ， 数 据 库 管 理 员 还 要 负责 定期 出 版 数据 字典 文件 及 一 些 其 他 数据 管理 文件 ， 
以 保留 系统 运行 和 修改 的 轨迹 。 当 系统 出 现 硬件 故障 并 得 到 排除 后 , 要 负责 数据 库 的 恢复 工作 。 

数据 维护 中 还 有 一 项 很 重要 的 内 容 , 那 就 是 代码 维护 。 不 过 代码 维护 发 生 的 频率 相对 较 小 。 
代码 的 维护 应 由 代码 管理 小 组 进行 。 变 更 代码 应 经 过 详细 讨论 ， 确 定之 后 要 用 书面 形式 贯彻 。 
代码 维护 的 困难 往往 不 在 于 代码 本 身 的 变更 ， 而 在 于 新 代码 的 贯彻 。 为 此 ， 除 了 成 立 专门 的 代 
码 管理 小 组 外 ， 各 业务 部 门 要 指定 专人 进行 代码 管理 ， 通 过 他 们 贯彻 使 用 新 代码 。 这 样 做 的 目 
的 是 要 明确 管理 职责 ， 有 助 于 防止 和 更 正 错 误 。 


9.5.2 ”系统 评价 


信息 系统 的 评价 分 为 广义 和 狭义 两 种 。 广 义 的 信息 系统 评价 是 指 从 系统 开发 的 一 开始 到 结 
束 的 每 一 阶段 都 需要 进行 评价 。 狭 义 的 信息 系统 评价 则 是 指 在 系统 建成 并 投入 运行 之 后 所 进行 
的 全 面 、 综 合 的 评价 。 

按 评价 的 时 间 与 信息 系统 所 处 的 阶段 的 关系 ， 又 可 从 总 体 上 把 广义 的 信息 系统 评价 分 成 立 
项 评价 、 中 期 评价 和 结 项 评价 。 

(1) 立项 评价 。 指 信息 系统 方案 在 系统 开发 前 的 预 评 价 , 即 系统 规划 阶段 中 的 可 行 性 研究 。 
评价 的 目的 是 决定 是 否 立项 进行 开发 ， 评 价 的 内 容 是 分 析 当前 开发 新 系统 的 条 件 是 否 具备 ， 明 
确 新 系统 目标 实现 的 重要 性 和 可 能 性 ， 主 要 包括 技术 上 的 可 行 性 、 经 济 上 的 可 行 性 、 管 理 上 的 
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可 行 性 和 开发 环境 的 可 行 性 等 方面 。 由 于 事前 评价 所 用 的 参数 大 都 是 不 确定 的 ， 所 以 评价 的 结 
论 具 有 一 定 的 风险 性 。 

(2) 中 期 评价 。 项 目 中 期 评价 包含 两 种 含义 ， 一 是 指 项 目 方案 在 实施 过 程 中 ， 因 外 部 环境 
出 现 重大 变化 ， 例 如 市 场 需 求 变 化 、 竞 争 性 技术 或 更 完美 的 替代 系统 的 出 现 ， 或 者 发 现 原先 设 
计 有 重大 失误 等 ， 需 要 对 项 目的 方案 进行 重新 评估 ， 以 决定 是 继续 执行 还 是 终止 该 方案 ， 另 一 
种 含义 也 可 称 为 阶段 评估 ， 是 指 在 信息 系统 开发 正常 情况 下 ， 对 系统 设计 、 系 统 分 析 、 系 统 实 
施 阶 段 的 阶段 性 成 果 进 行 评 估 。 由 于 一 般 都 将 阶段 性 成 果 的 提交 视 为 信息 系统 建设 的 里 程 碑 ， 
所 以 ， 阶 段 评 估 又 可 叫 里 程 碑 式 评价 。 

(3) 结 项 评价 。 信 息 系 统 的 建设 是 一 个 项 目 ， 是 项 目 就 需要 有 终结 时 间 。 结 项 评价 是 指 项 
目 准备 结束 时 对 系统 的 评价 ， 一 般 是 指 在 信息 系统 投入 正式 运行 以 后 ， 为 了 了 解 系统 是 否 达到 
预期 的 目的 和 要 求 而 对 系统 运行 的 实际 效果 进行 的 综合 评价 。 所 以 ， 结 项 评价 又 是 狭义 的 信息 
系统 评价 。 信 息 系统 项 目的 鉴定 是 结 项 评价 的 一 种 正规 的 形式 。 结 项 评价 的 主要 内 容 包 括 系统 
性 能 评价 、 系 统 的 经 济 效益 评价 以 及 企业 管理 效率 提高 、 管 理 水 平 改善 、 管 理 人 员 劳 动 强度 减 
轻 等 间接 效果 。 通 过 结 项 评价 ， 用 户 可 以 了 解 系统 的 质量 和 效果 ， 检 查 系 统 是 否 符合 预期 的 目 
的 和 要 求 ， 开 发 人 员 可 以 总 结 开发 工作 的 经 验 、 教 训 ， 这 对 今后 的 工作 十 分 有 益 。 
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数据 库 设 计 是 数据 库 应 用 领域 中 的 主要 研究 课题 。 数 据 库 设计 的 任务 是 针对 一 个 给 定 的 有 
用 环境 ， 在 给 定 的 《或 选择 的 ) 硬件 环境 和 操作 系统 及 数据 库 管理 系统 等 软件 环境 下 ， 创 建 一 
个 性 能 良好 的 数据 库 模 式 ， 建 立 数据 库 及 其 应 用 系统 ， 使 之 能 有 效 地 存储 和 管理 数据 ， 满 足 各 
类 用 户 的 需求 。 数 据 库 设 计 与 开发 是 一 项 庞大 而 复杂 的 工程 ， 合 理 的 数据 库 结构 是 数据 库 应 用 
系统 性 能 良好 的 基础 和 保证 。 为 了 有 效 地 保证 数据 库 设计 的 成 功率 ， 从 事 数据 库 设计 的 人 员 需 
要 注意 三 点 : 第 一 ， 要 具备 数据 库 知识 和 数据 库 设计 技术 ， 具 有 程序 开发 的 实际 经 验 ， 掌 握 软 
件 工程 的 原理 和 方法 ;第 二 ， 在 数据 库 应 用 系统 开发 前 ， 必 须 深 入 应 用 环境 ， 了 解 用 户 具 体 的 
专业 业务 ;第 三 ， 在 数据 库 设 计 的 前 期 和 后 期 ， 需 要 与 应 用 单位 人 员 密切 联系 ， 共 同 开发 。 


10.1 数据 库 设计 概述 


数据 库 设计 属于 系统 设计 的 范畴 。 通 常 把 使 用 数据 库 的 系统 统称 为 数据 库 应 用 系统 ， 把 对 
数据 库 应 用 系统 的 设计 简称 为 数据 库 设计 。 


10.1.1 数据 库 应 用 系统 的 生命 期 


按照 软件 工程 对 系统 生命 周期 的 定义 ， 软 件 生命 周期 分 为 6 个 阶段 : 制订 计划 、 需 求 分 析 、 
系统 设计 、 程 序 编制 、 测 试 以 及 运行 维护 。 在 数据 库 设计 实现 中 也 参照 这 种 划分 ， 把 数据 库 应 
用 系统 的 生命 周期 分 为 数据 库 规划 、 需 求 描述 与 分 析 、 数 据 库 与 应 用 程序 设计 、 数 据 库 设计 实 
现 、 测 试 、 运 行 维护 6 个 阶段 。 
1) 数据 库 规划 
数据 库 规划 是 创建 数据 库 应 用 系统 的 起 点 ， 是 数据 库 应 用 系统 的 任务 陈述 和 任务 目标 。 任 
务 陈述 定义 了 数据 库 应 用 系统 的 主要 目标 ， 而 每 个 任务 目标 定义 了 系统 必须 支持 的 特定 任务 。 
数据 库 规 划 过 程 还 包括 对 工作 量 的 估计 、 使 用 的 资源 和 需要 的 经 费 等 ， 同 时 还 应 当 定义 系统 的 
范围 和 边界 以 及 它 与 公司 信息 系统 的 其 他 部 分 的 接口 。 

2) 需求 描述 与 分 析 

需求 描述 与 分 析 是 以 用 户 的 角度 ， 从 系统 中 的 数据 和 业务 规则 入 手 ， 收 集 和 整理 用 户 的 信 
息 ， 以 特定 的 方式 加 以 描述 ， 是 下 一 步 工作 的 基础 。 


可 
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3) 数据 库 与 应 用 程序 设计 

数据 库 的 设计 是 对 用 户 数据 的 组 织 和 存储 设计 ， 应 用 程序 设计 是 在 数据 库 设 计 基 础 上 对 数 
据 操 作 及 业务 实现 的 设计 ， 包 括 事务 设计 和 用 户 界面 设计 。 

4) 数据 库 设计 实现 

数据 库 设计 实现 是 依照 设计 , 使 用 DBMS 支持 的 数据 定义 语言 (DDL) 实现 数据 库 的 建立 ， 
用 高 级 语言 (Basic、Delphi、C、C++、Powerbuilder 等 ) 编写 应 用 程序 。 

5) 测试 

测试 阶段 是 在 数据 系统 投入 使 用 之 前 ， 通 过 精心 制订 的 测试 计划 和 测试 数据 来 测试 系统 的 
性 能 是 否 满足 设计 要 求 ， 以 便 发 现 问题 。 

6) 运行 维护 

数据 库 应 用 系统 经 过 测试 、 试 运行 后 即 可 正式 投入 运行 。 运 行 维护 是 系统 投入 使 用 后 ， 必 
须 不 断 地 对 其 进行 评价 、 调 整 与 修改 ， 直 至 系统 消亡 。 

在 任 一 设计 阶段 ， 一 旦 发 现 不 能 满足 用 户 数 据 需 求 时 ， 均 需 返回 到 前 面 的 适当 阶段 进行 必 
要 的 修正 。 经 过 如 此 的 迭代 求 精 过 程 ， 直 到 能 满足 用 户 需求 为 止 。 在 进行 数据 库 结构 设计 时 ， 
应 考虑 满足 数据 库 中 数据 处 理 的 要 求 ， 将 数据 和 功能 两 方面 的 需求 分 析 、 设 计 和 实现 在 各 个 阶 
段 同时 进行 ， 相 互 参 照 和 补充 。 

事实 上 ， 在 数据 库 设 计 中 ， 对 每 一 个 阶段 设计 成 果 都 应 该 通过 评审 。 评 审 的 目的 是 确认 某 
一 阶段 的 任务 是 否 全 部 完成 ， 从 而 避免 出 现 重 大 的 错误 或 疏漏 ， 保 证 设计 质量 。 评 审 后 还 需要 
根据 评审 意见 修改 所 提交 的 设计 成 果 ， 有 时 甚至 要 回溯 到 前 面 的 某 一 阶段 ， 进 行 部 分 重新 设计 
乃至 全 部 重新 设计 ， 然 后 再 进行 评审 ， 直 至 达到 系统 的 预期 目标 为 止 。 


10.1.2 数据 库 设计 的 一 般 策 略 


数据 库 设计 的 一 般 策略 有 两 种 : 自 项 向 下 〈Top Down) 和 自 底 向 上 (Bottom Up)。 自 项 
向 下 是 从 一 般 到 特殊 的 开发 策略 。 它 是 从 一 个 企业 的 高 层 管理 着 手 ， 分 析 企 业 的 目标 、 对 象 和 
策略 ， 构 造 抽象 的 高 层 数据 模型 ， 然 后 逐步 构造 越 来 越 详细 的 描述 和 模型 〈 子 系统 的 模型 )。 
模型 不 断 地 扩展 细 化 ， 直 到 能 识别 特定 的 数据 库 及 其 应 用 为 止 。 

自 底 向 上 的 开发 采用 与 抽象 相反 的 顺序 进行 。 它 从 各 种 基本 业务 和 数据 处 理 着 手 ， 即 从 一 个 企 
业 的 各 个 基层 业务 子 系统 的 业务 处 理 开始 ， 进 行 分 析 和 设计 ; 然后 将 各 子 系统 进行 综合 和 集中 ， 进 
行 上 一 层 系 统 的 分 析 和 设计 ， 将 不 同 的 数据 进行 综合 ; 最 后 得 到 整个 信息 系统 的 分 析 和 设计 。 这 两 
种 方法 各 有 优 缺 点 ， 在 实际 的 数据 库 设 计 开 发 过 程 中 ， 常 常 把 这 两 种 方法 综合 起 来 使 用 。 


10.1.3 数据 库 设计 的 基本 步骤 
在 确定 了 数据 库 设 计 的 策略 以 后 ， 就 需要 相应 的 设计 方法 和 步骤 。 多 年 来 ， 人 们 提出 了 多 
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种 数据 库 设计 方法 ， 多 种 设计 准则 和 规范 。 但 考虑 数据 库 和 应 用 系统 开发 全 过 程 ， 将 数据 库 设 
计 分 为 如 下 六 个 阶段 。 

(1) 用 户 需求 分 析 。 数 据 库 设计 人 员 采 用 一 定 的 辅助 工具 对 应 用 对 象 的 功能 、 性 能 、 限 制 
等 要 求 所 进行 的 科学 分 析 。 

(2) 概念 结构 设计 。 概 念 结构 设计 是 对 信息 分 析 和 定义 ， 如 视图 模型 化 、 视 图 分 析 和 汇总 。 
对 应 用 对 象 精确 地 抽象 、 概 括 而 形成 的 独立 于 计算 机 系统 的 企业 信息 模型 。 描 述 概念 模型 的 较 
理想 的 工具 是 E-R 图 。 

(3) 逻辑 结构 设计 。 将 抽象 的 概念 模型 转化 为 与 选用 的 DBMS 产品 所 支持 的 数据 模型 相符 
合 的 逻辑 模型 ， 它 是 物理 结构 设计 的 基础 ， 包 括 模式 初始 设计 、 子 模式 设计 、 应 用 程序 设计 、 
模式 评价 以 及 模式 求 精 。 

(4) 物理 结构 设计 。 逻 辑 模 型 在 计算 机 中 的 具体 实现 方案 。 

(5) 数据 库 实施 阶段 。 数 据 库 设计 人 员 根 据 逻 辑 设计 和 物理 设计 阶段 的 结果 建立 数据 库 ， 
编制 与 调试 应 用 程序 ， 组 织 数据 入 库 ， 并 进行 试 运行 。 

(6) 数据 库 运 行 和 维护 阶段 。 数 据 库 应 用 系统 经 过 试 运行 即 可 投入 运行 ， 但 该 阶段 需要 不 
断 地 对 系统 进行 评价 、 调 整 与 修改 。 

数据 库 设 计 一 般 应 包括 数据 库 的 结构 设计 和 行为 设计 两 部 分 内 容 。 数 据 库 的 结构 设计 是 指 
系统 整体 逻辑 模式 与 子 模式 的 设计 ， 是 对 数据 的 分 析 设 计 ， 数据 库 的 行为 设计 是 指 施加 在 数据 
库 上 的 动态 操作 应 用 程序 集 ) 的 设计 ， 是 对 应 用 系统 功能 的 分 析 设 计 。 

数据 库 行为 设计 与 一 般 软 件 工程 的 系统 设计 及 产生 模块 化 程序 的 过 程 是 一 致 的 ， 并 且 从 学 
科 划 分 的 范畴 来 看 ， 它 更 偏重 于 软件 设计 。 在 系统 分 析 中 ， 过 早 地 将 “数据 分 析 ” 和 “功能 分 
析 ” 进 行 分 离 是 不 明智 的 ， 因 为 数据 需求 分 析 是 建立 在 功能 分 析 上 的 ， 只 有 通过 功能 分 析 ， 才 
能 产生 系统 数据 流程 图 与 数据 字典 ， 然 后 在 通过 数据 分 析 去 划分 实体 与 属性 等 ， 最 后 才能 进入 
结构 设计 。 


10.2 ”系统 需求 分 析 


系统 需求 分 析 是 在 项 目 确定 之 后 ， 用 户 和 设计 人 员 对 数据 库 应 用 系统 所 要 涉及 的 内 容 〈 数 
据 ) 和 功能 (行为 ) 的 整理 和 描述 ， 是 以 用 户 的 角度 来 认识 系统 。 这 一 过 程 是 后 续 开发 的 基础 ， 
因为 逻辑 设计 和 物理 设计 以 及 应 用 程序 的 设计 都 会 以 此 为 依据 。 如 果 这 一 阶段 的 工作 没有 做 
好 ， 会 给 以 后 的 工作 带 来 困难 ， 若 再 重新 做 需求 分 析 ， 将 影响 整个 项 目的 工期 ， 而 且 在 人 力 、 
掀 力 等 方面 造成 浪费 。 因 此 ， 这 一 阶段 的 工作 要 求 做 到 耐心 细致 ， 这 在 整个 设计 开发 过 程 中 是 
最 困难 、 最 耗 时 的 一 步 。 
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10.2.1 需求 分 析 的 任务 、 方 法 和 目标 


需求 分 析 阶 段 的 任务 : 综合 各 个 用 户 的 应 用 需求 ， 对 现实 世界 要 处 理 的 对 象 组 织 、 部 门 
和 企业 等 ) 进行 详细 调查 ， 在 了 解 现行 系统 的 概况 ， 确 定 新 系统 功能 的 过 程 中 ， 收 集 支持 系统 
目标 的 基础 数据 及 处 理 方法 。 

参与 需求 分 析 的 主要 人 员 是 分 析 人 员 和 用 户 ， 由 于 数据 库 应 用 系统 是 面向 企业 和 部 门 的 具 
体 业 务 ， 分 析 人 员 一 般 并 不 了 解 ， 而 同样 用 户 也 不 会 具有 系统 分 析 的 能 力 ， 这 就 需要 双方 进行 
有 效 的 沟通 ， 使 得 设计 人 员 对 用 户 的 各 项 业务 了 解 和 熟悉 ， 进 行 分 析 和 加 工 ， 将 用 户 眼中 的 业 
务 转换 成 为 设计 人 员 所 需要 的 信息 组 织 。 

分 析 和 表达 用 户 需 求 的 方法 主要 包括 自 项 向 下 和 自 底 向 上 两 类 方法 。 自 项 向 下 的 结构 化 分 
析 (Structured Analysis，SA) 方法 从 最 上 层 的 系统 组 织 机 构 入 手 ， 采 用 逐 层 分 解 的 方式 分 析 系 
统 ， 并 把 每 一 层 用 数据 流 图 和 数据 字典 描述 。 需 求 分 析 的 重点 是 调查 组 织 机 构 情况 ， 调 查 各 部 
门 的 业务 活动 情况 ， 协 助 用 户 明 确 对 新 系统 的 各 种 要 求 ， 确 定 新 系统 的 边界 ， 以 此 获得 用 户 对 
系统 的 如 下 要 求 。 

(1) 信息 要 求 。 用 户 需 要 在 系统 中 保存 哪些 信息 ， 由 这 些 保存 的 信息 要 得 到 什么 样 的 信息 ， 
这 些 信息 以 及 信息 间 应 当 满 足 的 完整 性 要 求 。 

(2) 处 理 要 求 。 用 户 在 系统 中 要 实现 什么 样 的 操作 功能 ?对 保存 信息 的 处 理 过 程 和 方式 ， 
各 种 操作 处 理 的 频 度 、 响 应 时 间 要 求 、 处 理 方式 等 以 及 处 理 过程 中 的 安全 性 要 求 和 完整 性 要 求 。 

(3) 系统 要 求 。 包 括 安全 性 要 求 、 使 用 方式 要 求 和 可 扩充 性 要 求 。 安 全 性 要 求 : 系统 有 几 
种 用 户 使 用 ， 每 一 种 用 户 的 使 用 权限 如 何 。 使 用 方式 要 求 : 用 户 的 使 用 环境 是 什么 ， 平 均 有 多 
少 用 户 同时 使 用 , 最 高 峰 时 有 多 少 用 户 同时 使 用 ,， 有 无 查询 相应 的 时 间 要 求 等 。 可 扩充 性 要 求 : 
对 未 来 功能 、 性 能 和 应 用 访问 的 可 扩充 性 的 要 求 。 

需求 分 析 阶 段 的 工作 以 及 形成 的 相关 文档 〈 作 为 概念 结构 设计 阶段 的 依据 ) 如 图 10-1 所 示 。 


| pp 二 和 G 三 二 
和 四 
| 
Wp, 用 户 活动 
数据 流程 
数据 库 设 计 用 户 数据 字典 
人 


员 


图 10-1 需求 分 析 阶段 的 工作 
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10.2.2 需求 分 析 阶 段 的 文档 


需求 调查 所 得 到 的 数据 可 能 是 零碎 的 、 局 部 的 ， 分 析 师 和 设计 人 员 必 须 进 一 步 分 析 和 表达 
用 户 的 需求 ， 建 立 需 求 说 明文 档 、 数 据 字典 和 数据 流 图 。 将 需求 调查 文档 化 ， 文 档 既 要 被 用 户 
所 理解 ， 又 要 方便 数据 库 的 概念 结构 设计 。 

数据 流 分 析 是 对 事务 处 理 所 需 的 原始 数据 的 收集 及 经 处 理 后 所 得 数据 及 其 流向 ,一般 用 数 
据 流 图 (DFD) 来 表示 。DFD 不 仅 指出 了 数据 的 流向 ， 而 且 还 指出 了 需要 进行 的 事务 处 理 〈 但 
并 不 涉及 如 何 处 理 ， 这 是 应 用 程序 的 设计 范畴 )。 除 了 使 用 数据 流 图 、 数 据 字 典 以 外 ， 需 求 分 
析 还 可 使 用 判定 表 、 判 定 树 等 工具 。 下 面 介 绍 数据 流 图 和 数据 字典 ， 其 他 工具 的 使 用 可 参见 软 
件 工程 等 方面 的 参考 书 。 
数据 字典 (Data Dictionary，DD) 是 各 类 数据 描述 的 集合 ， 它 是 关于 数据 库 中 数据 的 描述 ， 
即 元 数据 ， 而 不 是 数据 本 身 。 如 用 户 将 向 数据 库 中 输入 什么 信息 ， 从 数据 库 中 要 得 到 什么 信息 ， 
各 类 信息 的 内 容 和 结构 ， 信 息 之 间 的 联系 等 。 数 据 字 典 包 括 数据 项 、 数 据 结构 、 数 据 流 、 数 据 
存储 和 处 理 过 程 5 个 部 分 〈 至 少 应 该 包含 每 个 字段 的 数据 类 型 和 在 每 个 表 内 的 主键 、 外 键 )。 

数据 项 描述 = {数据 项 名 ， 数 据 项 含义 说 明 ， 别 名 ， 数 据 类 型 ， 长 度 ， 

取 值 范围 ， 取 值 含义 ， 与 其 他 数据 项 的 逻辑 关系 } 
数据 结构 描述 = {数据 结构 名 ,含义 说 明 ， 组 成 : {数据 项 或 数据 结构 }} 
数据 流 描 述 = {数据 流 名 ， 说 明 ， 数 据 流 来 源 ， 数 据 流 去 向 ， 
组 成 : {数据 结构 }， 平 均 流量 ， 高 峰 期 流量 } 
数据 存储 描述 = {数据 存储 名 ， 说 明 ， 编 号 ， 流 入 的 数据 流 ， 流 出 的 数据 流 ， 
组 成 : {数据 结构 }， 数 据 量 ， 存 取 方 式 } 
处 理 过 程 描 述 = {处 理 过程 名 说明， 输入 : {数据 流 }， 输 出 : {数据 流 } ， 
处 理 : {简要 说 明 }} 

需求 分 析 阶 段 的 成 果 是 系统 需求 说 明 书 , 主要 包括 数据 流 图 、 数 据 字 典 、 各 种 说 明 性 表格 、 
统计 输出 表 和 系统 功能 结构 图 等 。 系 统 需求 说 明 书 是 以 后 设计 、 开 发 、 测 试 和 验收 等 过 程 的 
要 依据 。 关 于 需求 分 析 的 详细 过 程 请 参见 第 9 章 。 


10.2.3 ”案例 分 析 


我 们 以 一 个 机 械 制 造 三 的 采购 业务 为 例 来 理解 需求 分 析 的 方法 步骤。 

1) 数据 字典 

(1) 数据 项 : 数据 项 是 数据 的 最 小 单位 ， 对 数据 项 的 描述 一 般 包 括 项 名 、 含 义 说 明 、 别 名 、 
类 型 、 长 度 、 取 值 范围 及 该 项 与 其 他 项 的 逻辑 关系 。 常 以 表格 的 形式 给 出 。 例 如 ， 采 购 业 务 中 


[i 
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订货 单 的 订货 单 号 ， 其 数据 项 的 描述 如 下 : 


数据 项 名 : 订货 单 号 

i 明 : 标识 每 张 定货 单 
类 ”型 : 字符 型 

长 度 : 8 


(2) 数据 结构 :数据 结构 是 若干 数据 项 的 有 意义 的 集合 ， 通 常 代表 某 一 具体 的 事物 ， 包 括 
数据 结构 名 、 含 义 、 组 成 成 分 等 。 如 对 采购 单 的 描述 : 


含 ” 义 : 记录 采购 信息 ， 包 括 采 购 什么 材料 及 其 数据 
组 成 成 份 : 采购 单 号 

材料 名 称 

数量 


(3) 数据 流 : 数据 流 可 以 是 数据 项 , 也 可 以 是 数据 结构 , 表示 某 一 次 处 理 的 输入 /输出 数据 ， 
包括 数据 流 名 、 说 明 、 数 据 来 源 、 数 据 去 向 ， 及 需要 的 数据 项 或 数据 结构 。 如 采购 计划 数据 流 。 


数据 流 名 : 采购 计划 
说 明 : 根据 生产 需要 的 原材料 ， 选 定 供 应 商 ， 编 制 采购 计划 
来 。 源 : 原材料 需求 表 


去 ”向 : 采购 单 
数据 结构 : 原材料 需求 表 
供应 商 


(4) 数据 存储 : 加 工 中 需要 存储 的 数据 ， 包 括 数据 存储 名 、 说 明 、 输 入 数据 流 、 输 出 数据 
流 、 组 成 成 分 、 数 据 量 、 存 取 方式 、 存 取 频 度 等 。 如 原材料 价目 表 ， 在 计算 成 本 和 支付 采购 费 
用 这 一 处 理 过 程 中 要 用 到 这 些 数据 。 

数据 存储 名 : 原材料 价 E 表 

说 明 : 记录 每 一 原材料 的 名 称 、 供 应 商 、 价 目 ， 在 计算 产品 成 本 和 
采购 费用 支付 处 理 中 使 用 
输入 数据 流 : 订购 单 
输出 数据 流 : 支付 费用 表 
数据 描述 ， ”原材料 名 称 
供应 商 
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(5) 处 理 过 程 ， 加 工 处 理 过 程 定义 和 说 明 。 包 括 处 理 名 称 、 输 入 数据 、 输 出 数据 、 数 据 存 
储 、 响 应 时 间 等 。 如 采购 支付 处 理 。 
处 理 过 程 名 : 采购 支付 
说 明 ， 根据 采购 单 、 原 材料 价目 表 ， 计 算出 应 付 原材料 采购 费用 
输入 数据 ， 采购 间 
数据 存储 ， 原材料 价目 表 
答 出 数据 ,支付 费用 表 
2) 数据 流 图 
采购 数据 流 图 如 图 10-2 所 示 。 


原材料 报价 供应 商 


零 配件 采购 记录 


图 10-2 采购 数据 流 图 
需求 分 析 阶 段 的 成 果 是 系统 需求 说 明 书 , 主要 包括 数据 流 图 、 数 据 字典、 各 种 说 明 性 表格 、 
统计 输出 表 、 系 统 功能 结构 图 和 等。 系统 需求 说 明 书 是 以 后 设计 、 开 发 、 测 试 和 验收 等 过 程 的 
要 依据 。 


10.3 概念 结构 设计 


数据 库 概念 结构 设计 阶段 是 在 需求 分 析 的 基础 上 ， 依 照 需求 分 析 中 的 信息 要 求 ， 对 用 户 信 
息 加 以 分 类 、 聚 集 和 概括 ， 建 立信 息 模型 ， 并 依照 选 定 的 数据 库 管理 系统 软件 ， 转 换 成 为 数据 
的 逻辑 结构 ， 再 依照 软 硬 件 环境 ， 最 终 实现 数据 的 合理 存储 。 这 一 过 程 也 称 为 数据 建 模 。 这 一 
过 程 可 分 解 为 三 个 阶段 :概念 结构 设计 、 风 辑 结构 设计 和 物理 结构 设计 。 


是 


10.3.1 概念 结构 设计 策略 与 方法 
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概念 结构 设计 的 目标 是 产生 反映 系统 信息 需求 的 数据 库 概念 结构 , 即 概念 模式 。 概念 结构 
是 独立 于 支持 数据 库 的 DBMS 和 使 用 的 硬件 环境 的 。 此 时 ， 设 计 人 员 从 用 户 的 角度 看 待 数据 
以 及 数据 处 理 的 要 求 和 约束 ， 产 生 一 个 反映 用 户 观点 的 概念 模式 ， 然 后 再 把 概念 模式 转换 为 逻 


辑 模 式 。 各 级 模式 之 间 的 关系 如 图 10-3 所 示 。 


概念 结构 设计 是 设计 人 员 以 用 户 的 观点 , 对 用 户 信息 的 抽象 和 描述 , 从 认识 论 的 角度 来 讲 ， 
是 从 现实 世界 到 信息 世界 的 第 一 次 抽象 ， 并 不 考虑 具体 的 数据 库 管 理 系统 。 


现实 世界 的 事物 纷繁 复杂 ， 即 使 是 对 某 一 具体 的 应 用 ， 由 于 存在 大 量 不 同 的 信息 和 对 信息 
的 各 种 处 理 ， 也 必须 加 以 分 类 整理 ， 理 清 各 类 信息 之 间 的 关系 ， 描 述 信息 处 理 的 流程 ， 这 一 过 
程 就 是 概念 结构 设计 。 


应 用 1 


综合 转换 


应 用 1 


应 用 2 
外 模式 


应 用 3 


逻 和 辑 模式 


内 模式 


图 10-3 各 级 模式 之 间 的 关系 
概念 结构 设计 的 策略 通常 有 以 下 4 种: 自 项 向 下 、 自 底 向 上 、 逐 步 扩张 和 混合 策略 。 实 际 


应 用 中 这 些 策略 并 没有 严格 的 限定 ， 可 以 根据 具体 业务 的 特点 选择 ， 如 对 于 组 织 机 构 管理 ， 因 


其 固有 的 层次 结构 ， 可 采用 自 顶 向 下 的 策略 ， 对 于 已 实现 计算 机 管理 的 业务 ， 通 常 可 以 以 此 为 


核心 ， 采 取 逐 步 扩张 的 策略 。 


概念 结构 设计 最 著名 最 常用 的 方法 是 PPS Chen 于 1976 年 提出 的 实体 -联系 方法 
(Entity-Relationship Approach)， 简 称 E-R 方法 。 它 采用 E-R 模型 将 现实 世界 的 信息 结构 统一 


有 实体 、 属 性 ， 以 及 实体 之 间 的 联系 来 描述 。 


使 用 E-R 方法 ,无论 是 哪 种 策略 ， 都 要 对 现实 事物 加 以 抽象 认识 ， 以 E-R 图 的 形式 描述 出 
来 。 对 现实 事物 抽象 认识 的 三 种 方法 分 别 是 分 类 、 聚 集 和 概括 。 
(1) 分 类 (Classification): 对 现实 世界 的 事物 ， 按 照 其 具有 的 共同 特征 和 行为 ， 定 义 一 


种 类 型 。 这 在 现实 生活 中 很 常见 的 ， 如 学 校 中 的 学 4 


和 教师 就 属于 不 同 的 类 型 。 在 某 一 类 型 中 ， 


个 体 是 类 型 的 一 个 成 员 或 实例 ， 即 “is member of”， 如 李娜 是 学 生 类 型 中 的 一 个 成 员 。 
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(2) 聚集 (Aggregation): 定义 某 一 类 型 所 具有 的 属性 。 如 学 生 类 型 具有 学 号 、 姓 名 、 性 
别 、 班 级 等 共同 属性 ， 每 一 个 学 生 都 是 这 一 类 型 中 的 个 体 ， 通 过 在 这 些 属性 上 的 不 同 取 值 来 区 
分 。 各 个 属性 是 所 属 类 型 的 一 个 成 分 ， 即 “is part of”， 如 姓名 是 学 生 类 型 的 一 个 成 分 。 

(3) 概括 〈Generalization): 由 一 种 已 知 类 型 定义 新 的 类 型 。 如 由 学 生 类 型 定义 研究 生 类 
型 ， 在 学 生 类 型 的 属性 上 增加 导师 等 其 他 属性 就 构成 研究 生 类 型 。 通 常 把 已 知 类 型 称 为 超 类 
(Superclass)， 新 定义 的 类 型 称 为 子 类 (Subclass)。 子 类 是 超 类 的 一 个 子 集 ， 即 “is subset of”， 
如 研究 生 是 学 生 的 一 个 子 集 。 


10.3.2 用 E-R 方法 建立 概念 模型 


E-R 图 的 设计 要 依照 上 述 的 抽象 机 制 ， 对 需求 分 析 阶 段 所 得 到 的 数据 进行 分 类 、 聚 集 和 概 
括 ， 确 定 实体 、 属 性 和 联系 。 概 念 结构 设计 工作 步骤 包括 : 选择 局 部 应 用 、 逐 一 设计 分 E-R 图 
和 E-R 图 合并 ， 如 图 10-4 所 示 。 


直人 号 


| 需 “| 上 概念 结构 设计 阶段 
1 求 11 
1 分 | | 抽象 
1 析 TT 1 数据 
| 阶 1 1 
段 1 
Wl CC——— 
Lt = 
功能 模块 图 
数据 流程 图 te 
数据 字典 E 
图 10-4 ”概念 结构 设计 工作 步骤 
1. 选择 局 部 应 用 


需求 分 析 阶 段 会 得 到 大 量 的 数据 ， 这 些 数 据 分 散 杂 乱 ， 许 多 数据 会 应 用 于 不 同 的 处 理 ， 数 
据 与 数据 之 间 关 联 关系 也 较为 复杂 ， 要 最 终 确 定 实体 、 属 性 和 联系 ， 就 必须 根据 数据 流 图 这 一 
线索 ， 理 清 数据 。 

数据 流 图 是 对 业务 处 理 过 程 从 高 层 到 底层 的 一 级 级 抽象 ， 高 层 抽象 流 图 一 般 反 映 系 统 的 概 
貌 ， 对 数据 的 引用 较为 笼统 ， 而 底层 又 可 能 过 于 细致 ， 不 能 体现 数据 的 关联 关系 ， 因 此 要 选择 
适当 层次 的 数据 流 图 ， 让 这 一 层 的 每 一 部 分 对 应 一 个 局 部 应 用 ， 实 现 某 一 项 功能 。 从 这 一 层 入 
手 ， 就 能 很 好 地 设计 分 E-R 图 。 
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2， 逐一 设计 分 E-R 图 


划分 好 各 个 局 部 应 用 之 后 , 就 要 对 每 一 个 局 部 应 用 逐一 设计 分 E-R 图 , 又 称 为 局 部 E-R 图 。 

对 于 每 一 局 部 应 用 ， 其 所 用 到 的 数据 都 应 该 收集 在 数据 字典 中 了 ， 依 照 该 局 部 应 用 的 数据 
流 图 ， 从 数据 字典 中 提取 出 数据 ， 使 用 抽象 机 制 ， 确 定局 部 应 用 中 的 实体 、 实 体 的 属性 、 实 体 
标识 符 及 实体 间 的 联系 及 其 类 型 。 

事实 上 ， 在 形成 数据 字典 的 过 程 中 ， 数 据 结 构 、 数 据 流 和 数据 存储 都 是 根据 现实 事物 来 确 
定 的 ， 因 此 都 已 经 基本 上 对 应 了 实体 及 其 属性 ， 以 此 为 基础 ， 加 以 适当 调整 ， 增 加 联系 及 其 类 
型 ， 就 可 以 设计 分 E-R 图 。 

现实 生活 中 许多 事物 ， 作 为 实体 还 是 属性 没有 明确 的 界定 ， 这 需要 根据 具体 情况 而 定 ， 一 
般 遵 循 以 下 两 条 准则 : 

(1) 属性 不 可 再 分 ， 即 属性 不 再 具有 需要 描述 的 性 质 ， 不 能 有 属性 的 属性 。 

(2) 属性 不 能 与 其 他 实体 发 生 联系 ， 联 系 是 实体 与 实体 间 的 联系 。 


3，E-R 图 合并 


根据 局 部 应 用 设计 好 各 局 部 E-R 图 之 后 , 就 可 以 对 各 分 E-R 图 进行 合并 。 合 并 的 目的 在 于 
在 合并 过 程 中 解决 分 E-R 图 中 相互 间 存 在 的 冲突 ， 消 除 分 E-R 图 之 间 存 在 的 信息 元 余 ， 使 之 成 
为 能 够 被 全 系统 所 有 用 户 共同 理解 和 接受 的 统一 的 、 精 炼 的 全 局 概念 模型 。 合 并 的 方法 是 将 具 
有 相同 实体 的 两 个 或 多 个 E-R 图 合 而 为 一 ， 在 合成 后 的 E-R 图 中 把 相同 实体 用 一 个 实体 表示 ， 
合成 后 的 实体 的 属性 是 所 有 分 E-R 图 中 该 实体 的 属性 的 并 集 ， 并 以 此 实体 为 中 心 ， 并 入 其 他 所 
有 分 E-R 图 。 再 把 合成 后 的 E-R 图 以 分 E-R 图 看 待 ， 合 并 剩余 的 分 E-R 图 ， 直 至 所 有 的 E-R 
图 全 部 合并 ， 就 构成 一 张 全 局 E-R 图 。 

注意 分 E-R 图 进行 合并 时 ， 它 们 之 间 存 在 的 冲突 主要 有 以 下 三 类 : 

(1) 属性 冲突 : 同一 属性 可 能 会 存在 于 不 同 的 分 E-R 图 , 由 于 设计 人 员 不 同 或 是 出 发 点 不 同 
对 属性 的 类 型 、 取 值 范 围 、 数 据 单位 等 可 能 会 不 一 致 ， 这 些 属 性 数据 将 来 只 能 以 一 种 形式 在 计算 
机 中 存储 ， 这 就 需要 在 设计 阶段 进行 统一 。 

(2) 命名 冲突 : 相同 意义 的 属性 ， 在 不 同 的 分 E-R 图 上 有 着 不 同 的 命名 ， 或 是 名 称 相同 的 
属性 在 不 同 的 分 E-R 图 中 代表 着 不 同 的 意义 ， 这 些 也 要 进行 统一 。 

(3) 结构 冲突 : 同一 实体 在 不 同 的 分 E-R 图 中 有 不 同 的 属性 ， 同 一 对 象 在 某 一 分 E-R 图 中 
被 抽象 为 实体 而 在 另 一 分 E-R 图 中 又 被 抽象 为 属性 ， 需 要 统一 。 

分 E-R 图 的 合并 过 程 中 要 对 其 进行 优化 ， 具 体 可 以 从 以 下 几 个 方面 实现 。 

(1) 实体 类 型 的 合并 : 两 个 具有 1:1 联系 或 1:* 联 系 的 实体 , 可 以 予以 合并 , 使 实体 个 数 减少 
有 利于 减少 将 来 数据 库 操作 过 程 中 的 连接 开销 。 


国 484 若 。 数据 库 系统 工程 师 教程 〈 第 3 版 ) 


(2) 元 余 属性 的 消除 : 一 般 在 各 分 E-R 图 中 的 属性 是 不 存在 元 余 的 ， 但 合并 后 就 可 能 出 现 元 
余 。 因为 合并 后 的 E-R 图 中 的 实体 继承 了 合并 前 该 实体 在 分 E-R 图 中 的 全 部 属性 , 属性 间 就 可 能 


存在 见 余 ， 即 某 一 属性 可 以 由 其 他 属性 确定 。 


(3) 元 余 联系 的 消除 : 在 分 E-R 图 合并 过 程 中 ， 可 能 会 出 现实 体 联系 的 环 状 结构 ， 即 某 一 实 


体 A 与 另 一 实体 B 间 有 直接 联系 ， 同 时 A 又 通过 其 他 实体 与 实体 B 发 生 间接 联系 ， 
系 可 以 通过 间接 联系 所 表达 ， 可 消除 直接 联系 。 


10.4 ”逻辑 结构 设计 


通常 直接 联 


逻辑 结构 设计 即 是 在 概念 结构 设计 的 基础 上 进行 数据 模型 设计 ， 可 以 是 层次 模型 、 网 状 模 


型 和 关系 模型 ， 本 节 介 绍 如 何在 全 局 E-R 图 基础 上 进行 关系 模型 的 逻辑 结构 设计 。 


逻辑 结构 设 


计 阶 段 的 主要 工作 步骤 包括 确定 数据 模型 、 将 E-R 图 转换 成 为 指定 的 数据 模型 、 确 定 完整 性 约 


束 和 确定 用 户 视图 ， 如 图 10-5 所 示 。 


~ re 


逻辑 结构 设计 阶段 


1 
| 人 1 
本 :省 
| 入 
1 阶 1 
1 段 1 
| A 


基本 E-R 图 罗 旬 模型 


图 10-5 ”逻辑 结构 设计 阶段 工作 步 又 


逻辑 结构 设计 阶段 的 主要 任务 是 : 确定 数据 模型 、 将 E-R 图 转换 成 为 指定 的 数据 模型 、 确 


定 完整 性 约束 和 确定 用 户 视图 。 
10.4.1 _E-R 图 向 关系 模式 的 转换 
E-R 方法 所 得 到 的 全 局 概念 模型 是 对 信息 世界 的 描述 ， 并 不 适用 于 计算 机 处 


E， 为 适合 关 


系数 据 库 系统 的 处 理 ， 必 须 将 E-R 图 转换 成 关系 模式 。E-R 图 是 由 实体 、 属 性 和 联系 三 要 素 构 


成 ， 而 关系 模型 中 只 有 唯一 的 结构 一 一 关系 模式 ， 通 常 采用 以 下 方法 加 以 转换 。 
1. 实体 向 关系 模式 的 转换 
将 E-R 图 中 的 实体 逐一 转换 成 为 一 个 关系 模式 ， 实 体 名 对 应 关系 模式 的 名 称 ， 


实体 的 属性 
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转换 成 关系 模式 的 属性 ， 实 体 标识 符 就 是 关系 的 码 。 
2. 联系 向 关系 模式 的 转换 


E-R 图 中 的 联系 有 三 种 : 一 对 一 联系 〈1:1)、 一 对 多 联系 〈1:*) 和 多 对 多 联系 〈#:*)， 针 
对 这 三 种 不 同 的 联系 ， 转 换 方 法 如 下 。 

(1) 一 对 一 联系 的 转换 。 一 对 多 联系 有 两 种 方式 向 关系 模式 进行 转换 。 一 种 方式 是 将 联系 
转换 成 一 个 独立 的 关系 模式 ， 关 系 模式 的 名 称 取 联 系 的 名 称 ， 关 系 模式 的 属性 包括 该 联系 所 关 
联 的 两 个 实体 的 码 及 联系 的 属性 ， 关 系 的 码 取 自 任 一 方 实体 的 码 ; 另 一 种 方式 是 将 联系 归并 到 
关联 的 两 个 实体 的 任 一 方 ， 给 待 归 并 的 一 方 实体 属性 集中 增加 另 一 方 实体 的 码 和 该 联系 的 属性 
即 可 ， 归 并 后 的 实体 码 保持 不 变 。 

(2) 一 对 多 联系 的 转换 。 一 对 多 联系 有 两 种 方式 向 关系 模式 进行 转换 。 一 种 方式 是 将 联系 
转换 成 一 个 独立 的 关系 模式 ， 关 系 模式 的 名 称 取 联 系 的 名 称 ， 关 系 模式 的 属性 取 该 联系 所 关联 
的 两 个 实体 的 码 及 联系 的 属性 ， 关 系 的 码 是 多 方 实体 的 码 ; 另 一 种 方式 是 将 联系 归并 到 关联 的 
两 个 实体 的 多 方 ， 给 待 归 并 的 多 方 实体 属性 集中 增加 一 方 实体 的 码 和 该 联系 的 属性 即 可 ， 归 并 
后 的 多 方 实体 码 保持 不 变 。 

(3) 多 对 多 联系 的 转换 。 多 对 多 联系 只 能 转换 成 一 个 独立 的 关系 模式 ， 关 系 模式 的 名 称 取 
联系 的 名 称 ， 关 系 模式 的 属性 取 该 联系 所 关联 的 两 个 多 方 实体 的 码 及 联系 的 属性 ， 关 系 的 码 是 
多 方 实体 的 码 构成 的 属性 组 。 


10.4.2 ”关系 模式 的 规范 化 


由 E-R 图 转换 得 来 的 初始 关系 模式 并 不 能 完全 符合 要 求 , 还 会 有 数据 元 余 、 更 新 异常 存在 ， 
这 就 需要 经 过 进一步 的 规范 化 处 理 ， 具 体 步骤 如 下 。 

(1) 根据 语义 确定 各 关系 模式 的 数据 依赖 。 在 设计 的 前 一 阶段 ， 只 是 从 关系 及 其 属性 来 描 
述 关系 模式 ， 并 没有 考虑 到 关系 模式 中 的 数据 依赖 。 关 系 模式 包含 着 语义 ， 要 根据 关系 模式 所 
描述 的 自然 主义 写 出 关系 数据 依赖 。 

(2) 根据 数据 依赖 确定 关系 模式 的 范式 。 由 关系 的 码 及 数据 依赖 ， 根 据 规范 化 理论 ， 就 可 
以 确定 关系 模式 所 属 的 范式 ， 判 定 关系 模式 是 否 符合 要 求 ， 即 是 否 达到 了 3NF 或 4NF。 

(3) 如 果 关 系 模式 不 符合 要 求 ， 要 根据 关系 模式 的 分 解 算法 对 其 进行 分 解 ， 达 到 3NF、 
BCNF 或 4NF。 

(4) 关系 模式 的 评价 及 修正 。 根 据 规范 化 理论 ， 对 关系 模式 分 解 之 后 ， 就 可 以 在 理论 上 消 
除 元 余 和 更 新 异常 。 但 根据 处 理 要 求 ， 可 能 还 需要 增加 部 分 元 余 以 满足 处 理 要 求 ， 这 就 需要 作 
部 分 关系 模式 的 处 理 ， 分 解 、 合 并 或 增加 元 余 属性 ， 提 高 存储 效率 和 处 理 效率 。 
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10.4.3 ”确定 完整 性 约束 


根据 规范 化 理论 确定 了 关系 模式 之 后 ， 还 要 对 关系 模式 加 以 约束 ， 包 括 数据 项 的 约束 、 表 
级 约束 及 表 间 约束 ， 可 以 参照 SQL 标准 来 确定 不 同 的 约束 ， 如 检查 约束 、 主 码 约束 、 参 照 完整 
性 约束 ， 以 保证 数据 的 正确 性 。 


10.4.4 ”用 户 视图 的 确定 


确定 了 整个 系统 的 关系 模式 之 后 ， 还 要 根据 数据 流 图 及 用 户 信息 建立 视图 模式 ， 提 高 数据 
的 安全 性 和 独立 性 。 

(1) 根据 数据 流 图 确定 处 理 过 程 使 用 的 视图 。 数 据 流 图 是 某 项 业务 的 处 理 ， 使 用 了 部 分 数 
据 ， 这 些 数据 可 能 要 跨越 不 同 的 关系 模式 ， 建 立 该 业务 的 视图 ， 可 以 降低 应 用 程序 的 复杂 性 ， 
并 提高 数据 的 独立 性 。 

(2) 根据 用 户 类 别 确定 不 同 用 户 使 用 的 视图 。 不 同 的 用 户 可 以 处 理 的 数据 可 能 只 是 整个 系 
统 的 部 分 数据 ， 而 确定 关系 模式 时 并 没有 考虑 这 一 因素 ， 如 学 校 的 学 生 管理 ， 不 同 的 院 系 只 能 
访问 和 处 理 自己 的 学 生 信息 ， 这 就 需要 建立 针对 不 同 院 系 的 视图 达到 这 一 要 求 ， 这 样 可 以 在 一 
定 程度 上 提高 数据 的 安全 性 。 


10.4.5 ”应 用 程序 设计 


应 用 程序 设计 与 开发 是 数据 库 应 用 系统 开发 的 重要 组 成 内 容 ， 它 应 遵循 应 用 软件 开发 的 
般 规律 ， 即 遵循 常规 的 软件 工程 的 方法 。 数 据 库 应 用 系统 开发 是 基于 DBMS 的 二 次 开发 ， 一 方 
面 是 对 用 户 信息 的 存储 ， 另 一 方面 就 是 对 用 户 处 理 要 求 的 实现 ， 通 常 在 设计 过 程 中 把 数据 存储 
的 设计 称 为 结构 设计 ， 处 理 的 实现 称 为 行为 设计 。 在 现 阶段 ， 还 没有 一 种 将 两 者 合 一 的 设计 方 
法 ， 而 称 之 为 行为 和 结构 分 离 的 设计 。 

应 用 程序 设计 有 两 种 方法 : 结构 化 设计 方法 和 面向 对 象 设 计 方 法 。 在 设计 阶段 就 是 从 分 析 
入 手 ， 得 到 结构 化 模型 或 面向 对 象 模型 。 


1. 结构 化 设计 方法 


结构 化 分 析 将 数据 和 处 理 作 为 分 析 对 象 ， 数 据 的 分 析 结 果 表 示 了 现实 世界 中 实体 的 属性 及 
其 之 间 的 相互 关系 ， 而 处 理 的 分 析 结 果 则 展现 了 系统 对 数据 的 加 工 和 转换 。 面 向 数据 流 建 模 是 
目前 仍然 被 广泛 使 用 的 方法 之 一 ， 而 DFD 则 是 面向 数据 流 建 模 中 的 重要 工具 ，DFD 将 系统 建 
模 成 输入 -处 理 -输出 的 模型 ， 即 流入 软件 的 数据 对 象 ， 经 由 处 理 的 转换 ， 最 后 以 结果 数据 对 象 
的 形式 流出 软件 。DFD 使 用 分 层 的 方式 表示 ， 第 一 个 数据 流 模 型 有 时 被 称 为 第 0 层 DFD 或 者 
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环境 数据 流 图 。 从 整体 上 表现 系统 ， 随 后 的 数据 流 图 将 改进 第 0 层 图 ， 并 增加 细节 信息 。 

除 DFD 外 ， 在 进行 建 模 时 ， 还 可 结合 数据 字典 和 加 工 处 理 说 明 对 DFD 进行 补充 。 数 据 字 
典 以 一 种 准确 的 和 无 二 义 的 方式 定义 所 有 被 加 工 引 用 的 数据 流 和 数据 存储 ， 通 常 包括 数据 流 条 
目 、 数 据 存储 条 目 和 数据 项 条 目 。 数 据 流 条 目 描述 DFD 中 数据 流 的 组 成 ， 数 据 存储 条 目 描述 
DFD 中 数据 存储 文件 的 组 成 ， 而 数据 项 条 目 则 描述 数据 流 或 数据 存储 中 所 使 用 的 数据 项 。 加 工 
处 理 的 说 明 则 可 采用 结构 化 自然 语言 、 判 定 表 和 判定 树 等 多 种 形式 进行 详细 描述 ， 其 目的 在 于 
说 明 加 工 做 什么 。 

掌握 上 述 的 工具 后 ， 即 可 对 问题 进行 结构 化 的 分 析 ， 其 实施 步骤 如 下 。 

(1) 确定 系统 边界 ， 画 出 系统 环境 图 。 

(2) 自 顶 向 下 ， 画 出 各 层 数据 流 图 。 

(3) 定义 数据 字典 。 

(4) 定义 加 工 说 明 。 

(5) 将 图 、 字 典 以 及 加 工 组 成 分 析 模 型 。 

DFD、 数 据 字典 和 处 理 加 工 说 明 可 以 充分 地 描述 系统 的 分 析 模 型 ， 其 后 需要 对 分 析 模 型 进 
行 变换 从 而 得 到 系统 的 总 体 设计 模型 。 系 统 总 体 设计 模型 可 以 采用 层次 图 、HIPO 图 和 结构 图 
来 表达 ， 但 不 论 是 哪 一 种 图 形 工具 ， 都 反映 了 模块 间 的 调用 关系 。 
在 分 析 模 型 的 基础 上 进行 设计 时 , 主要 是 针对 DFD 进行 变换 从 而 得 到 模块 的 调用 关系 图 ， 
此 ， 需 要 掌握 数据 流 的 变换 设计 与 事务 设计 。 面 向 数据 流 的 设计 方法 把 数据 流 图 映射 成 软件 
结构 , 数据 流 图 的 类 型 决定 了 映射 的 方法 , 数据 流 图 可 分 为 变换 型 数据 流 图 和 事务 型 数据 流 图 。 
变换 型 数据 流 图 具有 明显 的 输入 、 变 换 或 称 主 加 工 ) 和 输出 ; 而 事务 型 数据 流 图 则 是 数据 沿 
输入 通路 到 达 一 个 处 理 时 ， 这 个 处 理 根据 输入 数据 的 类 型 在 若干 动作 序列 中 选择 一 个 来 执行 。 
变换 设计 的 核心 在 于 确定 输入 流 和 输出 流 的 边界 ， 从 而 孤立 出 变换 中 心 ， 事务 设计 的 核心 在 于 
将 事务 类 型 判断 处 理 变换 成 调度 模块 以 选择 后 续 的 输出 分 支 模块 。 

经 过 总 体 设计 阶段 的 工作 ， 已 经 确定 了 软件 的 模块 结构 和 接口 描述 ， 但 每 个 模块 仍 被 看 作 
黑 盒子 。 后 续 的 详细 设计 目标 是 确定 怎样 具体 地 实现 所 要 求 的 系统 ， 经 过 详细 设计 ， 可 以 得 出 
对 目标 系统 的 精确 描述 ， 从 而 在 编码 阶段 可 以 将 这 个 描述 直接 翻译 成 用 某 种 程序 设计 语言 书写 
的 程序 。 因 此 ， 详 细 设 计 的 结果 基本 上 决定 了 最 终 的 程序 代码 的 质量 。 详 细 设 计 可 以 采用 程序 
流程 图 、N-S 图 、PAD 图 和 PDL 语言 等 工具 来 表达 。 

数据 库 应 用 程序 的 设计 可 以 借鉴 传统 的 结构 化 程序 设计 方法 ， 使 用 “输入 -处 理 -输出 ”模型 
编写 系统 结构 ， 这 些 模 型 大 部 分 依靠 数据 库 和 文件 ， 并 且 不 需要 复杂 的 实时 处 理 。 同 时 也 有 着 广 
泛 的 结构 化 程序 设计 语言 作 支 持 ， 如 C、Basic、Pascal、Fortran 等 。 


可 
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2. 面向 对 象 开发 方法 


目前 ， 面 向 对 象 分 析 和 设计 通常 采用 UML。UML 是 面向 对 象 的 标准 建 模 语 言 ， 通 过 统一 
的 语义 和 符号 表示 , 使 各 种 方法 的 建 模 过 程 和 表示 统一 起 来 , 已 成 为 面向 对 象 建 模 的 工业 标准 。 
UML 通过 事务 、 关 系 和 图 对 现实 世界 进行 建 模 。 
i 向 对 象 开发 方法 将 问题 和 问题 的 解决 方案 组 织 为 离散 对 象 的 集合 , 数据 结构 和 行为 都 包 
含 在 对 象 的 表示 中 。 面 向 对 象 的 特性 包括 表示 、 抽 象 、 分 类 、 封 装 、 继 承 、 多 态 和 持久 性 。 面 
向 对 象 开 发 方法 包括 面向 对 象 分 析 、 面 向 对 象 设计 和 面向 对 象 实现 。 面 向 对 象 分 析 强调 在 问题 
领域 内 发 现 和 描述 对 象 或 概念 。 

例如 ， 在 图 书馆 信息 系统 里 包含 了 书 、 图 书馆 和 顾客 这 样 一 些 概念 。 面 向 对 象 设计 采用 协 
作 的 对 象 、 对 象 的 属性 和 方法 说 明 软 件 解决 方案 的 一 种 方式 ， 强 调 的 是 定义 软件 对 象 和 这 些 软 
件 对 象 如 何 协 作 来 满足 需求 ， 是 面向 对 象 分 析 的 延续 。 例 如 ， 图 书馆 系统 中 的 软件 对 象 “ 书 ” 
可 以 有 “标题 ”属性 和 “获取 书 ” 方 法 ， 在 面向 对 象 编程 过 程 中 会 实现 设计 的 对 象 ， 如 Java 中 
的 Book 类 。 
面向 对 象 方法 中 分 析 和 设计 有 时 会 存在 一 部 分 重合, 不 是 完全 独立 的 活动 。 在 迭代 开发 中 ， 
不 严格 区 分 分 析 、 设 计 和 实现 ， 而 是 每 次 迭代 不 同 程度 地 进行 精 化 。 有 关 应 用 程序 设计 的 详细 
内 容 可 参考 本 书 第 九 章 。 


10.5 ”数据库 的 物理 设计 


数据 库 系 统 实现 是 离 不 开具 体 的 计算 机 的 ， 在 实现 数据 库 逻 辑 结构 设计 之 后 ， 就 要 确定 数 
据 库 在 计算 机 中 的 具体 存储 。 数据库 在 物理 设备 上 的 存储 结构 与 存 取 方法 称 为 数据 库 的 物理 结 
构 ， 它 依赖 于 给 定 的 计算 机 系统 。 为 一 个 给 定 的 逻辑 数据 模型 设计 一 个 最 适合 应 用 要 求 的 物理 
结构 的 过 程 ， 就 是 数据 库 的 物理 设计 。 


10.5.1 数据 库 物 理 设计 工作 过 程 


数据 库 的 物理 设计 工作 过 程 如 图 10-6 所 示 。 

在 数据 库 的 物理 结构 中 ， 数 据 的 基本 单位 是 记录 ， 记 录 是 以 文件 的 形式 存储 的 ， 一 条 存储 
记录 就 对 应 着 关系 模式 中 的 一 条 逻辑 记录 。 在 文件 中 还 要 存储 记录 的 结构 ， 如 各 字段 长 度 、 记 
录 长 度 等 ， 增 加 必要 的 指针 及 存储 特征 的 描述 。 

需要 注意 的 是 ， 数 据 库 的 物理 设计 是 离 不 开具 体 的 DBMS 的 ， 不 同 的 DBMS 对 物理 文件 
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存 取 方式 的 支持 是 不 同 的 , 设计 人 员 必 须 充分 了 解 所 用 DBMS 的 内 部 特征 , 根据 系统 的 处 理 要 
求 和 数据 的 特点 来 确定 物理 结构 。 
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图 10-6 数据 库 的 物理 设计 工作 过 程 


10.5.2 ”数据 库 物 理 设计 工作 步 又 
一 般 来 说 ， 物 理 设计 的 主要 工作 步骤 包括 确定 数据 分 布 、 存 储 结构 和 访问 方式 。 
1， 确 定数 据 分 布 


从 企业 计算 机 应 用 环境 出 发 ， 需 要 确定 数据 是 集中 管理 还 是 分 布 式 管理 ， 但 目前 企业 内 部 
网 及 因特网 的 应 用 越 来 越 广泛 ， 大 都 采用 分 布 式 管理 。 对 于 数据 如 何 分 布 需要 从 以 下 几 个 方面 
考虑 。 

(1) 根据 不 同 应 用 分 布 数据 。 企 业 的 不 同 部 门 一 般 会 使 用 不 同 数据 ， 将 与 部 门 应 用 相关 的 
数据 存储 在 相应 的 场地 ， 使 得 不 同 的 场地 上 处 理 不 同 的 业务 ， 对 于 应 用 多 个 场地 的 业务 ， 可 以 
通过 网 络 进行 数据 处 理 。 

(2) 根据 处 理 要 求 确定 数据 的 分 布 。 对 于 不 同 的 处 理 要 求 ， 也 会 有 不 同 的 使 用 频 度 和 响 
时 间 ， 对 于 使 用 频 度 高 、 响 应 时 间 短 的 数据 ， 应 存储 在 高 速 设 备 上 。 

(3) 对 数据 的 分 布 存储 必然 会 导致 数据 的 逻辑 结构 的 变化 ， 要 对 关系 模式 作 新 的 调整 ， 
到 数据 库 逻 辑 设计 阶段 作 必要 的 修改 。 

2. 确定 数据 的 存储 结构 

存储 结构 具体 指数 据 文件 中 记录 之 间 的 物理 结构 。 在 文件 中 , 数据 是 以 记录 为 单位 存储 的 ， 
可 以 采用 顺序 存储 、 哈 希 存储 、 堆 存储 和 B 树 存储 等 方式 。 在 实际 应 用 中 ， 要 根据 数据 的 处 理 
要 求 和 变更 频 度 选 定 合理 的 物理 结构 。 


已 


加 
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为 提高 数据 的 访问 速度 ， 通 常会 采用 索引 技术 。 在 物理 设计 阶段 ， 要 根据 数据 处 理 和 修改 
要 求 ， 确 定数 据 库 文 件 的 索引 字段 和 索引 类 型 。 


3. 确定 数据 的 访问 方式 


数据 的 访问 方式 是 由 其 存储 结构 所 决定 的 ， 采 用 什么 样 的 存储 结构 ， 就 使 用 什么 样 的 访问 
方式 。 数据 库 物 理 结构 主要 由 存储 记录 格式 、 记 录 在 物理 设备 上 的 安排 及 访问 路 径 〈 存 取 方法 ) 
等 构成 。 

1) 存储 记录 结构 设计 

存储 记录 结构 包括 记录 的 组 成 、 数 据 项 的 类 型 、 长 度 和 数据 项 间 的 联系 ， 以 及 逻辑 记录 到 存 
储 记录 的 映射 。 在 设计 记录 的 存储 结构 时 ， 并 不 改变 数据 库 的 逻辑 结构 ， 但 可 以 在 物理 上 对 记录 
进行 分 割 。 数据库 中 数据 项 的 被 访问 频率 是 很 不 均匀 的 , 基本 上 符合 公认 的 “80/20 规则 ” 即 “ 从 
数据 库 中 检索 的 80% 的 数据 由 其 中 的 20% 的 数据 项 组 成 ”。 

当 多 个 用 户 同时 访问 常用 数据 项 时 ， 会 由 于 访 盘 冲 突 而 等 待 。 如 果 将 这 些 数据 分 布 在 不 同 
的 磁盘 组 上 ， 当 用 户 同时 访问 时 ， 系 统 可 并 行 地 执行 1JO， 减 少 访 盘 冲 突 ， 提 高 数据 库 的 性 能 。 
所 以 对 于 常用 关系 ， 最 好 将 其 水 平分 割 成 多 个 片 ， 分 布 到 多 个 磁盘 组 上 ， 以 均衡 各 个 磁盘 组 的 
负荷 ， 发 挥 多 磁盘 组 并 行 操作 的 优势 。 

2) 存储 记录 布局 

存储 记录 的 布局 ， 就 是 确定 数据 的 存放 位 置 。 存 储 记 录 作 为 一 个 整体 ， 如 何 分 布 在 物理 区 
域 上 ， 是 数据 库 物 理 结构 设计 的 重要 一 环 。 聚 秘 功 能 可 以 大 大 提高 按 聚 侯 码 进行 查询 的 效率 。 
聚 徐 功能 不 但 可 用 于 单个 关系 ， 也 适用 于 多 个 关系 。 设 有 职工 表 和 部 门 表 ， 其 中 部 门 号 是 这 两 
个 表 的 公共 属性 。 如 果 查 询 涉及 这 两 个 表 的 连接 操作 ， 可 以 把 部 门 号 相同 的 职工 元 组 和 部 门 元 
组 在 物理 上 聚 簇 在 一 起 ， 既 可 显著 提高 连接 操作 的 速度 ， 又 可 节省 存储 空间 。 建 立 聚 簇 索引 的 
原则 如 下 。 

(1) 聚 秘 码 的 值 相 对 稳定 ， 没 有 或 很 少 需要 进行 修改 。 

(2) 表 主 要 用 于 查询 ， 并 且 通 过 聚 簇 码 进 行 访问 或 连接 是 该 表 的 主要 应 用 。 

(3) 对 应 每 个 聚 簇 码 值 的 平均 元 组 数 既 不 太 多 ， 也 不 太 少 。 

任何 事物 都 有 两 面 性 ， 聚 簇 对 于 某 些 特定 的 应 用 可 以 明显 地 提高 性 能 ， 但 对 于 与 聚 簇 码 无 
关 的 查询 却 毫 无 益处 。 相 反 地 ， 当 表 中 数据 有 插入 、 删 除 、 修 改 时 ， 关 系 中 有 些 元 组 就 要 被 搬 
动 后 重新 存储 ， 所 以 建立 聚 簇 的 维护 代价 是 很 大 的 。 

3) 存 取 方法 的 设计 

存 取 方 法 是 为 存储 在 物理 设备 (通常 是 外 存储 器 ) 上 的 数据 提供 存储 和 检索 的 能 力 。 存 
取 方 法 包括 存储 结构 和 检索 机 制 两 部 分 。 存 储 结构 限定 了 可 能 访问 的 路 径 和 存储 记录 ; 检索 机 
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制定 义 每 个 应 用 的 访问 路 径 。 

存 取 方法 是 快速 存 取 数据 库 中 数据 的 技术 。 数 据 库 系统 是 多 用 户 共享 系统 ， 对 同一 个 关系 
建立 多 条 存 取 路 径 才 能 满足 多 用 户 的 多 种 应 用 要 求 。 为 关系 建立 多 种 存 取 路 径 是 数据 库 物 理 设 
计 的 另 一 个 任务 。 在 数据 库 中 建立 存 取 路 径 最 普遍 的 方法 是 建立 索引 。 确 定 索引 的 一 般 顺 序 
如 下 。 

(1) 首先 可 确定 关系 的 存储 结构 ， 即 记录 的 存放 是 无 序 的 ， 还 是 按 某 属性 〈 或 属性 组 ) 聚 
簇 存放 。 这 在 前 面 已 讨论 过 ， 这 里 不 再 重复 。 

(2) 确定 不 宣 建立 索引 的 属性 或 表 。 对 于 太 小 的 表 、 经 常 更 新 的 属性 或 表 、 属 性 值 很 少 的 
表 、 过 长 的 属性 、 一 些 特殊 数据 类 型 的 属性 〈 大 文本 、 多 媒体 数据 ) 和 不 出 现 或 很 少 出 现在 查 
询 条 件 中 的 属性 不 宜 建立 索引 。 

(3) 确定 宜 建 立 索引 的 属性 。 例 如 关系 的 主 码 或 外 部 码 、 以 查询 为 主 或 只 读 的 表 、 范 围 查 
询 、 聚 集 函 数 (Min、Max、Avg、Sum、Count) 或 需要 排序 输出 的 属性 可 以 考虑 建立 索引 。 

索引 一 般 还 需 在 数据 库 运行 测试 后 ， 再 加 以 调整 。 在 RDBMS 中 ， 索 引 是 改善 存 取 路 径 的 
重要 手段 。 使 用 索引 的 最 大 优点 是 可 以 减少 检索 的 CPU 服务 时 间 和 IO 服务 时 间 ， 改 善 检索 效 
率 。 但 是 ， 不 能 对 进行 频繁 存储 操作 的 关系 建立 过 多 的 索引 ， 因 为 过 多 的 索引 也 会 影响 存储 操 


10.6 数据库 系统 的 实施 阶段 


数据 库 系统 的 实施 阶段 是 根据 设计 ， 由 开发 人 员 编 写 代码 程序 来 完成 的 。 包 括 数据 库 的 
操作 程序 和 应 用 程序 。 


1. 数据 库 实施 阶 段 的 工作 过 程 


在 数据 库 正式 投入 运行 之 前 ， 还 需要 完成 很 多 工作 。 例 如 ， 在 模式 和 子 模式 中 加 入 数据 库 
安全 性 、 完 整 性 的 描述 ， 编 写 应 用 程序 和 数据 导入 〈 装 入 )， 数 据 库 系统 的 试 运行 ， 并 在 试 运 
行 中 对 系统 进行 评价 。 如 果 评 价 结果 不 能 满足 要 求 ， 还 需要 对 数据 库 进行 修正 设计 ， 直 到 满意 
为 止 。 数据库 正式 投入 使 用 ， 也 并 不 意味 着 数据 库 设计 生命 周期 的 结束 ， 而 是 数据 库 维护 阶段 
的 开始 。 数 据 库 实施 阶段 的 工作 过 程 如 图 10-7 所 示 。 

在 完成 数据 库 的 设计 和 应 用 程序 的 设计 之 后 ， 开 发 人 员 应 该 根据 设计 的 内 容 ， 用 选 定 的 
RDBMS 提供 的 SQL 语言 及 其 他 高 级 语言 对 设计 进行 代码 编写 ,经 过 调试 产生 目标 模式 ,然后 
组 织 数据 入 库 。 

应 用 程序 的 编写 一 般 采 用 高 级 语言 如 C、Basic、Pascal、Fortran 等 来 实现 ， 当 然 也 有 专门 
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针对 数据 库 开 发 的 具有 高 级 语言 部 分 功能 的 开发 环境 ， 如 Power Builder 和 Delphi。 
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图 10-7 数据 库 实施 阶段 的 工作 过 程 


另外 ，SQL 作为 关系 数据 库 标准 语言 ， 己 经 被 大 量 的 DBMS 系统 所 使 用 ， 提 供 了 数据 定 
义 、 数 据 操纵 、 数 据 控制 等 功能 ， 能 够 实现 对 数据 库 的 操作 。 不 同 的 RDBMS 都 不 同 程度 地 实 
现 了 对 标准 SQL 的 支持 ， 在 语法 格式 上 也 可 能 有 些 差异 ， 需 要 参考 具体 RDBMS 的 参考 手册 。 

使 用 SQL 语言 编写 的 数据 库 操 作 程序 有 如 下 几 类 : 

。 数据 库 建 立 程序 ， 使 用 SQL 中 的 DDL 语言 

。 数据库 操纵 程序 ， 使 用 SQL 中 的 DML 语言 

。 事务 处 理 程序 ， 对 复杂 的 数据 操作 以 事务 的 形式 执行 

。 存储 过 程 和 触发 器 程序 

通常 ， 高 级 语言 用 来 编写 前 端 应 用 程序 ， 如 输入 /输出 界面 ， 和 一 些 复杂 的 数据 处 理 。 通 过 
采用 嵌入 式 SQL 或 数据 库 访 问 接口 (API) 实现 对 数据 库 的 操作 。 顽 入 式 SQL 由 于 编程 的 复杂 
性 ， 近 的 来 已 逐渐 被 使 用 ODBC、ADO 等 接口 技术 所 取代 。 


2. 数据 库 实施 


根据 逻辑 和 物理 设计 的 结果 , 在 计算 机 上 建立 起 实际 的 数据 库 结构 , 数据 加 载 ( 或 称 装 入 )， 
进行 试 运行 和 评价 的 过 程 ， 叫 作 数据 库 的 实施 〈 或 称 实现 )。 

1) 建立 实际 的 数据 库 结构 

用 DBMS 提供 的 数据 定义 语言 (DDL) 编写 描述 逻辑 设计 和 物理 设计 结果 的 程序 (一般 称 
为 数据 库 脚本 程序 )， 经 计算 机 编译 处 理 和 执行 后 ， 就 生成 了 实际 的 数据 库 结构 。 所 用 DBMS 
的 产品 不 同 ， 描 述 数据 库 结构 的 方式 也 不 同 。 有 的 DBMS 提供 数据 定义 语言 ， 有 的 提供 数据 库 
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结构 的 图 形 化 定义 方式 ， 有 的 两 种 方法 都 提供 。 在 定义 数据 库 结 构 时 ， 应 包含 以 下 内 容 。 

(1) 数据 库 模 式 与 子 模式 ， 以 及 数据 库 空 间 等 的 描述 。 例 如 ， 在 Oracle 系统 中 ， 数 据 库 逻 
辑 结 果 的 描述 包括 表 空间 (Tablespace)、 段 (Segment)、 范 围 (Extent) 和 数据 块 (Data block)。 
DBA 或 设计 人 员 通 过 对 数据 库 空 间 的 管理 和 分 配 , 可 控制 数据 库 中 数据 的 磁盘 分 配 , 将 确定 的 
空间 份额 分 配给 数据 库 用 户 ， 控 制 数据 的 可 用 性 ， 将 数据 存储 在 多 个 设备 上 ， 以 提高 数据 库 性 
能 等 。 

(2) 数据 库 完整 性 描述 。 所 谓 数据 的 完整 性 ， 是 指数 据 的 有 效 性 、 正 确 性 和 一 致 性 。 在 数 
据 库 设计 时 ， 如 果 没 有 一 定 的 措施 确保 数据 库 中 数据 的 完整 性 ， 就 无 法 从 数据 库 中 获得 可 信 的 
数据 。 数 据 的 完整 性 设计 ， 应 该 贯穿 在 数据 库 设 计 的 全 过 程 中 。 例 如 ， 在 数据 需求 分 析 阶 段 ， 
收集 数据 信息 时 , 应 该 向 有 关 用 户 调查 该 数据 的 有 效 值 范围 。 在 模式 与 子 模式 中 , 可 以 用 DBMS 
提供 的 DDL 语句 描述 数据 的 完整 性 。 

(3) 数据 库 安全 性 描述 。 数 据 安全 性 设计 同 数据 完整 性 设计 一 样 ， 也 应 在 数据 库 设计 的 各 
个 阶段 加 以 考虑 。 在 进行 需求 分 析 时 ， 分 析 人 员 除 了 收集 信息 及 数据 间 联 系 的 信息 之 外 ， 还 必 
须 收集 关于 数据 的 安全 性 说 明 。 在 设计 数据 库 逻 辑 结构 时 ， 对 于 保密 级 别 高 的 数据 ， 可 以 单独 
进行 设计 。 子 模式 是 实现 安全 性 要 求 的 一 个 重要 手段 ， 可 以 为 不 同 的 应 用 设计 不 同 的 子 模式 。 
在 数据 操纵 上 ， 系 统 可 以 对 用 户 的 数据 操纵 进行 两 方面 的 控制 : 一 是 给 合法 用 户 授权 ， 目 前 主 
要 有 身份 验证 和 口令 识别 ， 二 是 给 合法 用 户 不 同 的 存 取 权限 。 

(4) 数据 库 物理 存储 参数 描述 。 物 理 存储 参数 因 DBMS 的 不 同 而 不 同 。 一 般 可 设置 的 参数 
包括 块 大 小 、 页 面 大 小 〈 字 节 数 或 块 数 )、 数 据 库 的 页 面 数 、 缓 冲 区 个 数 、 缓 冲 区 大 小 和 用 户 
数 等 。 详 细 内 容 请 参考 DBMS 的 用 户 手册 。 

2) 数据 加 载 

数据 库 应 用 程序 的 设计 应 该 与 数据 库 设计 同时 进行 。 一 般 地 ， 应 用 程序 的 设计 应 该 包括 数 
据 库 加 载 程序 的 设计 。 在 数据 加 载 前 ， 必 须 对 数据 进行 整理 。 由 于 用 户 缺 乏 计算 机 应 用 背景 的 
知识 ， 常 常 不 了 解数 据 的 准确 性 对 数据 库 系统 正常 运行 的 重要 性 ， 因 而 未 对 提供 的 数据 作 严 格 
的 检查 。 所 以 ， 数 据 加 载 前 要 建立 严格 的 数据 登录 、 录 入 和 校 验 规范 ， 设 计 完 善 的 数据 校 验 与 
校正 程序 ， 排 除 不 合格 数据 。 

数据 加 载 分 为 手工 录入 和 使 用 数据 转换 工具 两 种 。 现 有 的 DBMS 都 提供 了 DBMS 之 间 数 
据 转 换 的 工具 。 如 果 用 户 原 来 就 使 用 数据 库 系统 ， 可 以 利用 新 系统 的 数据 转换 工具 。 先 将 原 系 
统 中 的 表 转 换 成 新 系统 中 相同 结构 的 临时 表 ， 然 后 对 临时 表 中 的 数据 进行 处 理 后 插入 到 相应 表 
中 。 数 据 加 载 是 一 项 费时 费力 的 工作 。 另 外 ， 由 于 还 需要 对 数据 库 系 统 进行 联合 调试 ， 所 以 大 
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部 分 的 数据 加 载 工 作 应 在 数据 库 的 试 运行 和 评价 工作 中 分 批 进行 。 

3) 数据 库 试 运行 和 评价 

当 加 载 了 部 分 必须 的 数据 和 应 用 程序 后 ， 就 可 以 开始 对 数据 库 系 统 进行 联合 调试 ， 称 为 数 
据 库 的 试 运行 。 一 般 将 数据 库 的 试 运行 和 评价 结合 起 来 的 目的 是 测试 应 用 程序 的 功能 ， 测 试 数 
据 库 的 运行 效率 是 否 达 到 设计 目标 ， 是 否 为 用 户 所 容忍 。 测 试 的 目的 是 为 了 发 现 问题 ， 而 不 是 
为 了 说 明 能 达到 哪些 功能 。 所 以 ， 测 试 中 一 定 要 有 非 设 计 人 员 的 参与 。 

用 户 数据 可 能 是 以 前 旧 系 统 的 数据 ， 并 不 完全 满足 新 系统 的 数据 要 求 ， 需 要 进行 处 理 ， 同 
时 还 要 做 好 新 系统 的 数据 库 的 转 储 和 恢复 工作 ， 以 免 发 生 故 障 时 丢失 数据 。 


10.7 ”数据库 运 行 维护 与 管理 


数据 库 系 统一 旦 投入 使 用 ， 会 面临 着 数据 的 不 断 更 新 和 频繁 的 访问 ， 随 着 时 间 的 推移 ， 会 
出 现 各 种 情况 影响 数据 库 的 效能 和 稳定 ， 如 何 保证 数据 库 安全 稳定 地 运行 ， 针 对 运行 中 出 现 的 
各 种 问题 如 何 解 决 ， 如 何 调整 使 得 数据 库 系 统 发 挥 更 大 地 效能 ， 是 本 节 要 讨论 的 问题 。 


10.7.1 制订 数据 库 系 统 的 运行 计划 


为 保证 数据 库 系 统 安全 稳定 地 运行 ， 需 要 综合 考虑 可 能 遇 到 的 各 种 问题 ， 制 订 详 尽 的 运行 
计划 和 应 对 措施 。 任何 的 因素 造成 系统 出 现 问题 ， 都 可 能 给 企业 带 来 损失 。 数 据 库 系统 的 运行 
计划 主要 包括 三 个 方面 : 数据 库 系统 运行 策略 、 数 据 库 系 统 监控 对 象 和 监控 方式 以 及 数据 
库 系统 管理 计划 。 


1. 制订 运行 策略 


要 使 数据 库 系 统 能 够 正常 运行 ， 必 须 制 订 运 行 策略 ， 运 行 策略 的 制订 要 从 两 个 方面 考虑 : 
正常 运行 策略 和 非 正常 运行 策略 。 

1) 正常 运行 策略 

正常 运行 策略 是 指 在 正常 运行 状态 下 的 数据 库 执行 策略 。 任 何 一 个 系统 在 一 般 情 况 下 都 有 
相对 固定 的 用 户 群 和 访问 量 ， 系 统 的 负载 相对 稳定 。 正 常 运行 策略 需要 从 以 下 几 个 方面 考虑 。 
(1) 系统 运行 对 物理 环境 的 要 求 。 为 保障 系统 的 稳定 运行 ， 离 不 开 系统 的 物理 环境 保障 。 
物理 环境 包括 运行 场地 的 温度 、 湿 度 、 通 风 条 件 、 灰 尘 指标 、 电 力 供应 等 外 部 条 件 。 
(2) 系统 运行 对 人 员 的 要 求 。 作 为 企业 运行 中 的 数据 库 ， 是 需要 专人 服务 的 。 包 括 成 立 数 
据 库 运行 管理 机 构 ， 专 门 负责 数据 库 系 统 的 运行 。 

(3) 数据 库 的 安全 性 策略 。 数 据 库 的 运行 离 不 开 用 户 的 访问 和 操作 ， 安 全 性 策略 包括 网 络 
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安全 、 用 户 的 权限 管理 、 设 备 的 安全 、 数 据 的 安全 等 方面 。 

(4) 数据 库 备 份 和 恢复 策略 。 数 据 库 系 统 运行 中 数据 是 不 断 变更 和 增长 的 。 有 些 系统 会 产 
生 大 量 的 数据 ， 这 些 数据 如 果 不 能 及 时 从 系统 中 导出 ， 系 统 的 存储 设备 会 很 快 占 满 而 不 能 正常 
运行 ， 需 要 根据 业务 量 ， 制 订 数 据 备 份 策略 ， 定 期 从 系统 中 导出 数据 。 同 时 备份 也 是 系统 故障 
恢复 所 必须 的 。 

2) 非 正常 运行 策略 

非 正常 运行 策略 是 指 在 特殊 时 期 的 数据 库 运 行 策略 。 系 统 运行 不 可 能 是 一 成 不 变 的， 在 各 
种 因素 的 影响 下 ， 系 统 会 处 于 特殊 的 运行 时 期 。 非 正常 运行 策略 需要 从 以 下 几 个 方面 考虑 ; 

(1) 突 发 事件 的 应 对 策略 。 突 发 事件 可 能 是 突然 断 电 、 设 备 故 障 等 因素 ， 甚 至 可 能 是 火灾 、 
水 灾 等 人 力 不 可 抗拒 的 自然 灾害 ， 必 须要 有 及 时 的 应 对 策略 ， 如 启动 备用 电源 和 备用 设备 ， 使 
系统 能 够 正常 运行 。 

(2) 高 负载 状态 的 应 对 策略 。 数 据 库 系 统 的 高 负载 状态 与 企业 的 业务 相关 ， 有 些 是 可 以 预 
计 的 ， 如 节日 中 的 话 务 系 统 ， 有 些 则 是 事先 难以 估计 的 ， 如 大 幅 涨 跌 时 的 股票 交易 系统 。 针 对 
高 负载 时 的 系统 运行 ， 也 要 求 有 正确 的 应 对 策略 ， 进 行 系统 负载 平衡 。 


2. 确定 数据 库 系统 监控 对 象 和 监控 方式 


数据 库 系 统 运行 过 程 中 ， 需 要 管理 员 及 时 了 解数 据 库 的 运行 状态 ， 掌 握 运行 状态 中 的 各 种 
指标 ， 为 改进 系统 提供 依据 。 对 系统 运行 状态 的 了 解 采用 监控 的 手段 。 

1) 数据 库 系 统 监控 对 象 

数据 库 系 统 监控 的 对 象 分 别 是 系统 性 能 、 系 统 故障 和 系统 安全 ， 依 照 监控 对 象 的 不 同 ， 系 
统 监控 分 为 性 能 监控 、 故 障 监控 、 安 全 监控 。 

性 能 监控 是 掌握 系统 运行 性 能 的 手段 。 性 能 监控 应 当 从 资源 占用 率 、 事 务 响应 时 间 、 事 务 
量 、 死 锁 、 用 户 量 等 方面 实现 。 

故障 监控 是 保障 数据 库 系统 正常 运行 的 手段 。 从 数据 库 系统 故障 的 类 型 入 手 ， 监 控 事 务 故 
障 、 系 统 故障 和 介质 故障 ， 出 现 需要 管理 员 干预 的 故障 时 及 时 恢复 。 

安全 监控 是 对 破坏 数据 库 安全 事件 的 监控 ， 包 括 入 侵 监控 、 用 户 访问 监控 、 病 毒 监 控 等 。 

在 进行 系统 监控 的 同时 可 以 设 定 出 现 严重 问题 时 的 系统 报警 ， 及 时 通知 管理 员 进 行 干预 ， 
保障 系统 稳定 地 运行 。 

2) 数据 库 系 统 监控 方式 

数据 库 系 统 的 监控 方式 分 为 系统 监控 和 应 用 程序 监控 。 

(1) 系统 监控 是 通过 DBMS 提供 的 监控 功能 ， 进 行 参数 设 定 后 ， 由 系统 自动 监控 。 不 同 的 
DBMS 软件 都 不 同 程度 上 提供 了 监控 功能 ， 管 理 员 可 以 有 效 地 利用 。 
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(2) 应 用 程序 监控 需要 管理 人 员 根 据 具体 情况 编制 应 用 程序 进行 系统 监控 , 是 对 DBMS 监 
控 功 能 的 补充 。 

需要 注意 的 是 ， 系 统 日 志 是 监控 中 的 主要 依据 。 日 志文 件 详细 记录 了 系统 运行 中 的 各 种 信 
息 ， 管 理 员 可 以 从 日 志文 件 中 了 解 系统 运行 状态 和 事件 ， 以 此 为 据 发 现 系 统 运行 中 的 问题 。 


3. 数据 库 系统 管理 计划 


数据 库 系 统 运行 过 程 中 离 不 开 对 系统 的 有 效 管理 , 包括 性 能 管理 、 故 障 /恢复 管理 、 安 全 性 
管理 、 完 整 性 管理 和 用 户 教育 与 培训 以 及 系统 的 维护 。 针 对 这 些 管理 ， 要 有 详尽 的 管理 内 容 和 
计划 ， 有 关内 容 可 以 参阅 后 续 数 据 库 系 统管 理 小 节 。 


10.7 .2 ”数据 库 系 统 的 运行 和 维护 


1. 监控 数据 的 收集 与 分 析 


系统 监控 能 够 动态 地 掌握 数据 库 的 运行 状态 ， 监 控 就 是 对 系统 运行 信息 的 记录 ， 称 为 监控 
数据 ， 监 控 数据 是 发 现 系统 问题 和 改进 系统 性 能 的 依据 。 依 照 监 控 的 类 型 ， 监 控 数 据 分 为 性 能 
监控 数据 、 故 障 监控 数据 和 安全 监控 数据 。 

监控 数据 通常 可 以 从 DBMS 系统 监控 功能 指定 的 记录 文件 中 获取 , 有 些 运 行 信息 可 能 记录 
在 系统 日 志 中 ， 管理 员 编制 的 监控 脚本 也 可 以 指定 监控 数据 的 存储 文件 ， 从 这 些 文件 中 可 以 得 
到 监控 数据 。 

监控 数据 是 系统 运行 状态 的 反映 , 对 于 监控 数据 的 分 析 , 目的 在 于 判定 系统 运行 是 否 正常 ， 
是 否 满足 设计 要 求 和 应 用 要 求 ， 出 现 问 题 的 根源 在 哪里 ， 给 出 解决 问题 的 方案 ， 为 进一步 改进 

性 能 监控 数据 包括 磁盘 使 用 信息 (碎片 量 、 剩余 空 间 、 日 志文 件 增长 情况 ), 1/O 操作 数量 、 
频 度 及 响应 时 间 ， 缓 冲 区 命中 率 ， 事 务 量 及 锁 状 况 。 通 过 分 析 这 些 数据 ， 找 出 影响 性 能 的 问题 
所 在 ， 为 下 一 步 性 能 调整 提供 依据 。 

故障 监控 数据 的 分 析 ， 可 以 找 出 故障 的 原因 ， 是 事务 处 理 程序 的 内 部 错误 ， 还 是 系统 调度 
的 问题 ， 以 及 是 否 因为 系统 硬件 故障 ， 做 出 相应 的 处 理 。 

安全 监控 数据 主要 是 记录 用 户 对 数据 库 的 访问 和 修改 操作 ， 可 以 通过 日 志文 件 来 得 到 ， 判 
定 是 否 有 未 授权 用 户 的 存 取 ， 分 析 安 全 漏洞 的 原因 ， 对 用 户 管理 和 应 用 程序 加 以 改进 。 


2. 稳定 运行 中 的 业务 持续 性 


业务 持续 性 是 指 一 个 组 织 的 主要 业务 流程 ， 营 运 服务 ， 以 及 IT 服务 能 够 得 到 连续 性 处 理 。 
在 一 个 突 发 事件 中 ， 公 司 的 主要 业务 、 服 务 流程 、 设 备 、 人 员 等 因素 都 有 着 各 自 的 持续 性 
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要 求 。 公 司 的 开 部 门 和 其 他 职能 部 门 必 须 相 互 配 合 工 作 ,， 不 仅仅 体现 在 业务 持续 的 计划 中 , 更 
需要 在 具体 的 实施 过 程 中 得 到 实现 。 

业务 持续 性 需要 从 以 下 方面 考虑 。 

(1) 界定 哪些 是 不 允许 停工 的 持续 性 业务 ， 哪 些 是 允许 有 一 定时 间 的 停工 期 的 弹性 业务 。 

(2) 要 有 业务 持续 性 的 技术 体系 ， 如 高 效率 服务 器 、 存 储 系统 、 网 络 、DBMS 。 

(3) 检测 和 响应 管理 ， 包 括 紧急 决策 制定 、 准 备 工 作 、 最 初 的 紧急 响应 和 系统 恢复 等 所 有 
详细 程序 。 

(4) 要 有 保障 业务 持续 性 的 设备 。 

(5) 界定 相关 人 员 的 职务 和 权 责 。 包 括 各 类 技术 人 员 程序 员 、 管 理 员 和 操作 员 )， 执 行 
经 理 ( 紧 急事 件 决策 者 )， 设 备 管理 人 员 (电力 、 供 冷 、 电 绕 )， 人 力 资源 ‘人事 问题 和 需求 )， 
业务 实体 (业务 流程 )， 以 及 外 部 组 织 ( 外 包机 构 、 电 信 、 供 应 商 等 )。 


3. 数据 库 维护 


只 有 数据 库 顺利 地 进行 了 实施 ， 才 可 将 系统 交付 使 用 。 数 据 库 一 旦 投入 运行 ， 就 标志 着 数 
据 库 维护 工作 的 开始 。 数据 库 维护 工作 的 内 容 主要 包括 对 数据 库 的 监测 和 性 能 改善 、 故 障 恢 复 、 
数据 库 的 重组 和 重 构 。 在 数据 库 运行 阶段 ， 对 数据 库 的 维护 主要 由 DBA 完成 。 

1) 对 数据 库 性 能 的 监测 和 改善 

性 能 可 以 用 处 理 一 个 事务 的 IO 量 、CPU 时 间 和 系统 响应 时 间 来 度量 。 由 于 数据 库 应 用 环 
境 、 物理 存储 的 变化 , 特别 是 用 户 数 和 数据 量 的 不 断 增加 ， 数据库 系统 的 运行 性 能 会 发 生变 化 。 
某 些 数据 库 结 构 〈 如 数据 页 和 索引 ) 经 过 一 段 时 间 的 使 用 以 后 ， 可 能 会 被 破坏 。 所 以 ，DBA 必 
须 利用 系统 提供 的 性 能 监控 和 分 析 工 具 , 经 常 对 数据 库 的 运行 、 存 储 空间 及 响应 时 间 进 行 分 析 ， 
结合 用 户 的 反映 确定 改进 措施 。 目 前 的 DBMS 都 提供 一 些 系统 监控 或 分 析 工具 。 例 如 , 在 SQL 
Server 中 使 用 SQL Server Profiler 组 件 、Transaction-SQL 工具 和 Query Analyzer 组 件 等 都 可 进行 
系统 监测 和 分 析 。 

2) 数据 库 的 备份 及 故障 恢复 

数据 库 是 企业 的 一 种 资源 ， 所 以 在 数据 库 设 计 阶段 , DBA 应 根据 应 用 要 求 制定 不 同 的 备份 
方案 ,保证 一 旦 发 生 故障 能 很 快 将 数据 库 恢复 到 某 种 一 致 性 状态 ， 尽 量 减少 损失 。 数 据 库 的 备 
份 及 故障 恢复 方案 ， 一 般 基 于 DBMS 提供 的 恢复 手段 。 

3) 数据 库 重 组 和 重 构 

数据 库 运 行 一 段 时 间 后 ， 由 于 记录 的 增 、 删 、 改 ， 数 据 库 物 理 存储 碎片 记录 链 过 多 ， 影 响 
数据 库 的 存 取 效 率 。 这 时 ， 需 要 对 数据 库 进 行 重组 和 部 分 重组 。 数据库 的 重组 是 指 在 不 改变 数 
据 库 逻 辑 和 物理 结构 的 情况 下 ， 去 除数 据 库存 储 文件 中 的 废弃 空间 以 及 碎片 空间 中 的 指针 链 ， 
使 数据 库 记 录 在 物理 上 紧 连 。 
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数据 库 系 统 运行 过 程 中 ， 会 因为 一 些 原因 而 对 数据 库 的 结构 作 修 改 ， 称 为 数据 库 重 构 。 
构 包 括 表 结 构 的 修改 和 视图 的 修改 。 表 结构 的 修改 有 数据 列 的 增删 和 修改 、 约 束 的 修改 、 表 的 
分 解 与 合并 。 需 要 注意 的 是 DBMS 有 一 定 的 逻辑 独立 性 ， 某 些 修 改 可 能 不 需要 修改 应 用 程序 ， 
以 减少 系统 运 维 的 代价 。 因 此 ， 对 于 如 下 情况 数据 库 重组 和 重 构 的 处 理 方法 : 

(1) 修改 属性 列 名 或 数据 类 型 : 由 于 修改 表 中 的 属性 列 名 或 数据 类 型 ， 必 须 修 改 使 用 该 表 
的 应 用 程序 ， 所 以 应 尽量 减少 这 样 的 修改 。 

(2) 增加 和 删除 属性 : 只 修改 使 用 该 列 的 应 用 程序 。 

(3) 约束 的 修改 : 如果 是 DBMS 支持 的 约束 ， 如 主 码 约束 、 参 照 完整 性 约束 和 检查 约束 ， 
一 般 不 需要 修改 应 用 程序 ， 复 杂 的 约束 可 以 通过 修改 触发 器 程序 实现 。 

(4) 表 的 分 解 : 可 以 通过 建立 与 分 解 前 表 同名 的 视图 来 避免 修改 应 用 程序 。 但 这 样 会 相应 
引起 性 能 的 下 降 ， 如 果 分 解 是 为 了 提高 性 能 ， 则 需要 修改 应 用 程序 ， 只 访问 分 解 后 的 一 个 表 。 

(5) 表 的 合并 : 通常 也 是 为 了 提高 系统 性 能 ， 可 以 通过 建立 两 个 与 原 表 同名 的 视图 来 避免 
应 用 程序 的 修改 。 
视图 机 制 的 优点 是 可 以 实现 数据 的 逻辑 独立 性 ， 并 且 可 以 实现 数据 的 安全 性 。 采 用 视图 机 
制 可 将 不 允许 应 用 程序 访问 的 数据 屏蔽 在 视图 之 外 。 但 是 在 数据 库 重 构 过 程 中 引入 或 修改 视 
图 ， 可 能 会 影响 数据 的 安全 性 ， 所 以 必须 对 视图 进行 评价 和 验证 ， 保 证 不 能 因为 数据 库 的 重 构 
而 引起 数据 的 泄密 。 

文档 是 对 系统 结构 和 实现 的 描述 ， 在 系统 设计 开发 和 维护 过 程 中 起 着 重要 的 指导 作用 。 文 
档 必 须 与 系统 保持 高 度 的 一 臻 性， 否则 会 造成 人 为 的 困难 和 错误 ， 甚 至 危及 系统 的 生命 。 对 于 
数据 库 重 构 中 的 所 有 修改 ， 必 须 在 文档 中 体现 出 来 。 

注意 : 由 于 数据 库 重 构 的 困难 和 复杂 性 ， 一 般 都 在 迫不得已 的 情况 下 才 进 行 。 例 如 ， 应 用 
需求 发 生 了 变化 ， 需 要 增加 新 的 应 用 或 实体 ， 取 消 某 些 应 用 或 实体 。 又 如 ， 表 的 增删 、 表 中 数 
据 项 的 增删 、 数 据 项 类 型 的 变化 等 。 重 构 数 据 库 后 ， 还 需要 修改 相应 的 应 用 程序 ， 并 且 重 构 也 
只 能 对 部 分 数据 库 结构 进行 。 一 旦 应 用 需求 变化 太 大 ， 需 要 对 全 部 数据 库 结构 进行 重组 ， 说 明 
该 数据 库 系 统 的 生命 周期 已 经 结束 ， 需 要 设计 新 的 数据 库 应 用 系统 。 


4. 数据 库 系 统 的 运行 统计 


系统 监控 和 系统 运行 统计 是 DBA 掌握 数据 库 系统 运行 状态 的 最 有 效 手段 ， 系 统 监 控 通常 
用 来 保障 系统 的 稳定 运行 ， 运 行 统计 则 是 用 来 了 解 系统 性 能 ， 作 为 性 能 调整 的 依据 。 

系统 的 运行 统计 是 通过 DBMS 提供 的 工具 实现 的 , 也 有 第 三 方 软件 可 供 使 用 。 可 以 将 统计 
数据 以 图 、 表 等 多 种 形式 提供 ， 并 给 出 相应 的 分 析 结 果 。DBA 可 以 通过 统计 数据 ， 了 解 系统 性 
E 和 资源 占用 情况 ， 实 施 系统 改进 和 资源 配置 ， 以 提供 系统 性 能 。 


姓 


到 
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运行 统计 可 以 是 长 期 的 ， 也 可 以 是 阶段 性 的 。 如 对 访问 量 的 统计 是 长 期 的 ， 峰 值 时 期 的 统 
计 则 是 为 了 掌握 系统 的 负荷 能 力 ， 因 此 是 阶段 性 的 。 


5. 数据 库 系统 的 审计 


审计 是 一 种 DBMS 工具 ， 它 记录 数据 库 资源 和 权限 的 使 用 情况 。 启 用 审计 功能 ， 可 以 产生 
审计 跟踪 信息 ， 包 括 哪些 数据 库 对 象 受到 了 影响 ， 谁 在 什么 时 候 执行 了 这 些 操作 。 
审计 是 被 动 的 ， 它 只 能 在 跟踪 对 数据 库 的 修改 而 不 能 防止 ， 但 作为 一 个 安全 性 手段 ， 起 到 
对 非法 入 侵 的 威慑 作用 ， 可 以 据 此 追究 非法 入 侵 者 的 法 律 责任 。 
审计 功能 的 开启 会 影响 到 系统 的 性 能 ， 尤 其 是 在 一 个 忙碌 的 系统 中 ， 会 导致 性 能 的 降低 。 
而 且 审计 跟踪 信息 会 被 保存 下 来 ， 引 起 存储 空间 的 问题 。 解 决 这 一 问题 的 方法 是 通过 对 DBMS 
范围 内 的 不 同 级 别 进行 审计 操作 ， 例 如 ， 在 数据 库 级 别 、 数 据 库 对 象 级 别 和 在 用 户 级 别 进行 审 
计 。 根 据 不 同 级 别 有 选 择 地 进行 审计 ， 可 以 使 对 存储 和 性 能 的 负面 影响 降 到 最 小 。 


10.7.3 数据 库 系 统 的 管理 


1. 数据 字典 的 管理 


数据 字典 (Data Dictionary) 是 存储 在 数据 库 中 的 所 有 对 象 信息 的 知识 库 ， 存 有 用 户 信息 、 
用 户 的 权限 信息 、 所 有 数据 对 象 、 表 的 约束 条 件 、 统 计 分 析 数 据 库 的 视图 等 信息 。 通 常 把 数据 
字典 中 存储 的 数据 称 为 元 数据 (Meta Data)， 是 用 来 描述 数据 ， 如 字段 的 类 型 、 长 度 等 信息 。 
系统 对 数据 库 的 访问 ， 是 由 数据 字典 中 的 元 数据 所 提供 的 信息 来 访问 具体 数据 的 ， 同 时 也 可 以 
通过 元 数据 可 以 了 解数 据 库 对 象 的 信息 。 

当 用 户 使 用 DDL 语言 定义 数据 库 对 象 或 某 些 DML 语言 进行 表 扩 展 等 操作 时 , 系统 会 自动 
修改 数据 字典 中 的 元 数据 。 数 据 字典 是 只 读 的 , 可 以 利用 DBMS 提供 相应 的 数据 字典 访问 命令 ， 
访问 数据 字典 的 内 容 。 

在 系统 运行 阶段 ， 如果 对 数据 库 对 象 结构 信息 进行 修改 ， 则 系统 会 自动 地 反映 到 数据 字典 
中 。 需 要 注意 的 是 ， 这 些 修改 可 能 会 关系 到 应 用 程序 的 对 数据 库 的 正确 访问 ， 所 以 ， 可 以 通过 
数据 字典 的 信息 对 应 用 程序 做 相应 的 修改 。 


2. 数据 完整 性 维护 和 管理 


数据 库 的 完整 性 是 指数 据 语言 上 的 一 致 性 ， 对 从 语义 角度 限定 数据 ， 有 关 完 整 性 的 详细 说 
明 参 见 本 书 第 11 章 的 相关 内 容 。 

数据 的 完整 性 是 通过 DBMS 系统 提供 的 完整 性 约束 机 制 和 应 用 程序 来 实现 ， 以 保证 运行 
过 程 中 数据 的 正确 性 。 
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在 系统 运行 过 程 中 对 数据 完整 性 的 维护 和 管理 采用 两 种 方式 。 

(1) 对 于 DBMS 管理 的 约束 ， 通 过 修改 数据 库 的 定义 ， 如 增加 或 删除 实体 完整 性 约束 、 
参照 完整 性 约束 、 检 查 约束 来 实现 。 

(2) 对 于 应 用 程序 实现 的 复杂 的 完整 性 约束 ， 通 过 分 析 和 修改 应 用 程序 ， 通 常 是 采用 触发 
器 程序 来 实现 。 


3. 数据 库 的 存储 管理 


数据 库 中 的 数据 是 以 文件 的 形式 存储 在 物理 存储 设备 上 的 ， 通 常 是 磁盘 系统 。 应 用 程序 通 
过 DBMS 完成 IO 操作 来 访问 数据 。1/O 操作 的 效率 直接 影响 到 系统 的 运行 效率 ， 提 高 系统 访 
问 效率 的 有 效 手段 就 是 提高 IO 操作 的 效率 。 

在 数据 库 系统 运行 过 程 中 ， 随 着 数据 的 不 断 变更 ， 会 影响 到 系统 的 响应 效率 。 通 过 以 下 手 
段 进 行 存储 管理 ， 可 有 效 地 提高 系统 性 能 。 

(1) 索引 文件 和 数据 文件 分 开 存储 ， 事 务 日 志文 件 存储 在 高 速 设备 上 。 

(2) 适时 修改 数据 文件 和 索引 文件 的 页 面 大 小 。 

(3) 定期 对 数据 进行 排序 。 

(4) 增加 必要 的 索引 项 。 

除 进 行 数据 库 的 存储 管理 之 外 ， 也 可 以 通过 增加 计算 机 内 存 、 引 入 高 速 存储 设备 等 方式 来 
提高 系统 的 访问 效率 。 


4. 备份 和 恢复 


在 数据 库 系统 运行 过 程 中 ， 可 能 会 发 生 故障 而 破坏 数据 ， 采 用 的 措施 是 进行 数据 库 备 份 ， 
有 关 备 份 与 恢复 的 概念 参阅 本 书 第 11 章 的 相关 内 容 。 

随 着 存储 设备 稳定 性 的 不 断 提 高 ， 硬 件 故 障 发 生 的 概率 越 来 越 小 ， 故 障 主要 集中 在 由 应 用 
程序 引起 的 事务 故障 和 系统 故障 上 ， 目 前 绝 大 多 数 的 DBMS 系统 都 提供 了 备份 和 恢复 机 制 , 在 
系统 运行 过 程 中 ， 管 理 员 需要 做 的 工作 主要 是 做 好 备份 和 日 志 管理 工作 。 

备份 计划 的 制定 和 实施 ， 有 以 下 建议 。 

(1) 根据 数据 变更 情况 ， 设 定 合理 的 备份 周期 和 备份 时 间 ， 最 好 是 在 业务 量 最 小 的 时 段 进 
行 备份 。 

(2) 事务 日 志文 件 保存 在 最 稳定 的 存储 设备 上 。 

(3) 定期 在 事务 日 志文 件 中 加 入 检查 点 〈Checkpoint)。 

检查 点 记录 了 数据 库 的 正确 状态 点 ， 在 数据 库 恢复 过 程 中 ， 就 可 以 反 向 扫描 日 志文 件 ， 找 
到 第 一 个 检查 点 ， 执 行 Undo 和 Redo 操作 ， 减 少 恢复 的 时 间 开 销 。 
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5. 并 发 控制 与 死 锁 管理 


一 般 多 用 户 数据 库 管 理 系统 都 提供 了 并 发 控制 机 制 ， 来 实现 事务 的 并 发 调度 并 进行 死 锁 管 
理 ， 实 际 运行 中 的 数据 库 系 统 ， 死 锁 的 产生 往往 是 因为 事务 程序 的 错误 。 管 理 员 通过 系统 监控 
工具 或 系统 日 志 ， 找 出 频繁 产生 死 锁 的 事务 ， 分 析 死 锁 的 原因 ， 修 改 事务 程序 来 减少 死 锁 ， 提 
高 系统 的 并 发 性 。 


6. 数据 安全 性 管理 


有 关 数 据 库 安 全 性 方面 的 知识 可 以 参阅 本 书 第 11 章 的 相关 内 容 。 实 际 运行 中 的 数据 库 系 
统 可 以 从 以 下 几 个 方面 实现 安全 性 管理 : 

(1) 建立 网 络 级 安全 ， 主 要 是 防火 墙 的 设置 。 

(2) 操作 系统 级 安全 ， 进 行 登录 用 户 的 管理 。 

(3) DBMS 级 安全 ， 对 访问 数据 库 的 用 户 进行 密码 验证 。 

(4) 角色 和 用 户 的 授权 管理 。 

(5) 建立 视图 和 存储 过 程 加 强 安全 性 。 

(6) 使 用 审计 功能 ， 为 追 纠 非法 入 侵 者 法 律 责任 提供 证 据 ， 发 现 安全 漏洞 。 


10.7 .4 ”性 能 调整 


在 数据 库 系统 运行 过 程 中 , 如 何 尽 可 能 地 提高 系统 的 性 能 , 是 系统 管理 员 的 主要 工作 之 一 。 
系统 的 性 能 一 方面 取决 于 DBMS 的 性 能 及 其 参数 设 定 ， 而 在 指定 的 DBMS 环境 下 ， 与 具体 的 
应 用 系统 也 有 很 大 的 关系 ， 可 通过 调整 来 提高 性 能 。 


1. SQL 语句 的 编码 检验 


通过 DBMS 提供 的 监控 和 统计 功能 ， 找 出 频繁 执行 的 SQL 语句 ， 通 常 是 查询 语句 ， 对 其 
进行 优化 ， 常 用 的 策略 如 下 。 

(1) 尽 可 能 地 减少 多 表 查 询 或 建立 物化 视图 。 

(2) 以 不 相关 子 查询 替代 相关 子 查询 。 

(3) 只 检索 需要 的 列 。 

(4) 用 带 IN 的 条 件 子 句 等 价 蔡 换 OR 子 句 。 

(5) 经 常 提交 COMMIT， 以 尽早 释放 锁 。 


2. 表 设 计 的 评价 
在 设计 阶段 , 我 们 提出 了 关系 模式 的 设计 应 当 符 合 3NF 或 BCNF, 目的 是 为 了 减少 数据 元 
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余 和 消除 操作 异常 。 但 在 数据 库 系统 运行 过 程 中 ， 需 要 根据 实际 情况 对 表 进 行 调整 。 调 整 的 原 
则 主要 有 如 下 三 个 方面 。 

(1) 如 果 频 繁 的 访问 是 对 两 个 相关 的 表 进 行 连接 操作 ， 则 考虑 将 其 合并 。 

(2) 如 果 频 繁 的 访问 只 是 在 表 中 的 某 一 部 分 字段 上 进行 ， 则 考虑 分 解 表 ， 将 该 部 分 单独 作 
为 一 个 表 。 

(3) 对 于 更 新 很 少 的 表 , 引入 物化 视图 。 物化 视图 (Materialized View) 是 一 种 特殊 的 物理 表 ， 
物化 视图 是 相对 普通 视图 而 言 的 。 普 通 视 图 是 虚拟 表 〈 不 存放 数据 的 表 )， 任 何 对 视图 的 查询 ， 
都 需要 转换 为 对 应 的 SQL 语句 进行 查询 。 


3. 索引 维护 和 改进 


在 数据 库 运 行 期 间 ， 数 据 库 系统 管理 员 (DBA) 必须 对 数据 库 的 索引 进行 维护 和 改进 。 这 
是 因为 用 户 频繁 地 对 数据 进行 增加 、 删 除 、 修 改 等 操作 使 得 索引 页 发 生 碎 块 ， 所 以 DBA 必须 
对 索引 进行 维护 。 另 外 ，DBA 可 针对 具体 的 情况 ， 对 系统 中 的 索引 进行 改进 以 提高 性 能 ， 即 可 
以 适当 地 调整 索引 。 调 整 索引 的 原则 主要 有 如 下 四 个 方面 。 

(1) 如 果 查 询 是 瓶颈 ， 则 在 关系 上 建立 适应 的 索引 ， 通 常 在 作为 查询 条 件 的 属性 上 建立 索 
引 ， 可 以 提高 查询 效率 。 

(2) 如 果 更 新 是 瓶颈 ， 每 次 更 新 都 会 重建 表 上 的 索引 ， 引 起 效率 的 降低 ， 则 考虑 删除 某 些 
索引 。 

(3) 选择 适当 的 索引 类 型 ， 如 果 是 经 常 使 用 范围 查询 ， 则 B 树 索引 比 散 列 索引 更 高 效 。 

(4) 将 有 利于 大 多 数据 查询 和 更 新 的 索引 设 为 聚 簇 索引。 


4. 设备 增强 

在 数据 库 系统 运行 过 程 中 ， 如 果 经 过 各 种 调整 之 后 ， 仍 不 能 满足 性 能 要 求 ， 则 应 当 考 虑 增 
强 系统 设备 。 例 如 ， 引 入 高 速 的 计算 机 、 增 加 系统 内 存 、 使 用 高 速 的 网 络 设 备 和 高 速 的 存储 设 
备 等 方面 。 当 然 ， 设 备 的 增强 需要 企业 的 资金 投入 ， 应 当 考 虑 合适 的 性 价 比 和 投入 产 出 比 ， 还 
需要 说 服 决策 者 同意 。 
10.7.5 用 户 支持 


1. 用 户 培训 

数据 库 应 用 系统 离 不 开 用 户 的 使 用 ， 良 好 的 界面 设计 和 用 户 手 册 可 以 方便 用 户 的 使 用 , 但 
定期 的 培训 是 必 不 可 少 的 。 
户 的 分 类 : 根据 使 用 系统 的 内 容 和 权限 ， 可 以 将 用 户 分 为 以 下 三 类 。 
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(1) 各 级 管理 者 : 通常 是 业务 经 理 上 至 总 经 理 等 管理 层 ， 主 要 关心 系统 统计 数据 。 

(2) 业务 雇员 : 这 类 人 员 是 与 系统 打交道 最 多 的 人 。 

(3) 外 部 用 户 : 对 于 开放 的 数据 库 系统 ， 会 有 企业 之 外 的 人 员 进行 访问 ， 甚 至 是 修改 数据 
库 的 内 容 ， 如 电子 商务 、 网 上 银行 中 的 客户 。 
用 户 培训 主要 是 对 内 部 人 员 ， 即 管理 者 和 雇员 的 培训 ,尤其 是 业务 雇员 ， 由 于 这 类 人 员 往 往 
变动 性 大 ， 对 业务 不 熟悉 ， 计 算 机 操作 水 平 有 限 ， 必 须 经 过 培训 考核 才 可 以 胜任 。 

培训 的 内 容 和 目的 如 下 。 

(1) 了 解 业 务 流程 及 规范 ， 方 便 数 据 库 系统 的 使 用 。 

(2) 掌握 应 用 程序 操作 ， 正 确 地 使 用 和 维护 数据 。 

(3) 培养 安全 意识 ， 防 止 泄露 或 破坏 数据 。 


2. 售后 服务 


由 于 数据 库 应 用 系统 的 复杂 性 ， 无 论 是 DBMS 的 供应 商 还 是 应 用 系统 的 开发 商 ， 都 不 可 
能 保证 自己 的 产品 不 会 有 任何 问题 ， 最 终 用 户 也 不 可 能 完全 有 能 力 解决 系统 中 出 现 的 问题 ， 良 
好 的 售后 服务 直接 关系 到 企业 的 信誉 。 售 后 服务 通常 包含 的 内 容 如 下 。 

(1) 成 立 专门 的 客户 服务 机 构 解决 用 户 的 技术 问题 ， 包 括 热线 服务 和 上 门 服务 。 

(2) 用 户 技术 培训 。 

(3) 优惠 的 系统 升级 。 
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事务 管理 是 对 于 一 系列 数据 库 操作 进行 管理 。 在 多 个 事务 并 发 执行 的 数据 库 系统 中 ， 如 果 
对 共享 数据 的 更 新 不 进行 控制 ， 就 会 产生 数据 的 不 一 致 性 ， 导 致 数据 库存 储 数 据 错误 。 运 行 中 
的 数据 库 系统 是 很 容易 受到 来 自 多 方面 的 干扰 和 破坏 。 如 软 、 硬 件 系统 故障 ， 合 法 用 户 的 误 操 
作 , 非法 入 侵 等 等 。 数 据 库 的 保护 就 是 要 排除 和 防止 各 种 对 数据 库 的 干扰 破坏 ， 确 保 数据 安全 、 
可 靠 ， 以 及 在 数据 库 已 经 遭 到 破坏 后 如 何 尽快 地 恢复 正常 。 数 据 库 的 保护 是 通过 对 数据 库 的 恢 
复 、 安 全 性 控制 、 完 整 性 控制 和 并 发 控制 四 个 方面 来 实现 的 。 
本 章 重点 介绍 了 事务 的 基本 概念 、 数 据 的 备份 与 恢复 、 数 据 库 并 发 控制 和 数据 库 安全 等 方 
面 的 内 容 。 


11.1 事务 的 基本 概念 


11.1.1 事务 


1. 概述 


事务 〈Transaction) 是 一 系列 的 数据 库 操作 ， 是 数据 库 应 用 程序 的 基本 逻辑 单位 ， 即 应 用 
程序 对 数据 库 的 操作 都 应 该 以 事务 的 方式 进行 。 
事务 是 一 个 操作 序列 ， 这 些 操 作 “ 要 么 都 做 ， 要 么 都 不 做 ”， 是 数据 库 环 境 中 不 可 分 割 的 
逻辑 工作 单位 。 事 务 和 程序 是 两 个 不 同 的 概念 ， 一 般 一 个 程序 可 包含 多 个 事务 。 
事务 通常 由 数据 库 操纵 语言 或 其 他 高 级 语言 (如 SQL、CoBOL、C、C++、Java 等 ) 书写 
的 用 户 程 序 来 实现 。 一 个 事务 由 应 用 程序 的 一 组 操作 序列 组 成 ， 它 以 BEGIN TRANSACTION 
语句 开始 ， 以 END TRANSACTION 结束 语句 。 
事务 定义 的 语句 如 下 。 

(1) BEGIN TRANSACTION: 事务 开始 。 

(2) END TRANSACTION: 事务 结束 。 

(3) COMMIT: 事务 提交 。 该 操作 表示 事务 成 功 地 结束 ， 它 将 通知 事务 管理 器 该 事务 的 所 
有 更 新 操作 现在 可 以 被 提交 或 永久 地 保留 。 

(4) ROLLBACK: 事务 回 滚 。 该 操作 表示 事务 非 成 功 地 结束 ， 它 将 通知 事务 管理 器 出 故 
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障 了 ， 数 据 库 可 能 处 于 不 一 致 状态 ， 该 事务 的 所 有 更 新 操作 必须 回 滚 或 撤销 。 


典型 的 例子 是 银行 转账 业务 。 对 “从 账户 A 转 入 账户 B 金额 x 元 ”业务 ， 站 在 顾客 角 


来 看 ， 转 账 是 一 次 单独 操作 ;而 站 在 数据 库 系统 中 它 至 少 是 由 两 个 操作 组 成 的 ， 第 一 步 从 账户 
A 减 去 x 元 ， 第 二 步 给 账户 B 加 上 x 元。 下面 是 银行 转账 事务 的 伪 代 码 : 


BEGIN TRANSACTION 
read(A); 证 读 账 户 A 的 余额 */ 
A=A-x; 
IF(A<0) THEN 
print(“ 金 额 不 足 ， 不 能 转账 ”); 
ROLLBACK; /# 撤 销 该 事务 ， 回 到 事务 执行 前 的 状态 和 
ELSE 
write(A); /#* 写 入 账户 A 的 余额 #/ 
read(B); 
B=B+1; 
write(B); 
COMMIT; 让 提交 事务 */ 
ENDIF; 
END TRANSACTION 


2. SQL 中 事务 的 开始 与 结束 


SQL 标准 规定 当 一 条 SQL 语句 被 执行 , 就 隐 式 地 开始 了 一 个 事务 , SQL 中 的 Commit work 
和 Rollback work 语句 之 一 会 结束 一 个 事务 。 

(1) Commit work: 提交 当前 事务 。 这 意味 着 将 该 事务 所 做 的 更 新 在 数据 库 中 永久 保存 。 
一 旦 事务 被 提交 后 ， 一 个 新 的 事务 自动 开始 。 

(2) Rollback work: 回 滚 当前 事务 。 这 意味 着 将 撤销 该 事务 对 数据 库 的 更 新 。 这 样 ， 数 据 
库 恢复 到 该 事务 执行 第 一 条 语句 之 前 的 状态 。 

需要 注意 的 是 ， 若 事务 已 执行 了 Commit work， 就 不 能 用 Rollback work 来 撤销 。 数 据 库 系 


统 能 保证 在 
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诸如 某 条 SQL 语句 错误 、 断 电 、 系统 骨 溃 的 情况 下 , 若 事务 还 没有 执行 Commit 


work， 则 所 造成 的 影响 将 被 回 滚 。 对 断 电 、 系 统 崩 溃 的 情况 ， 回 滚 是 在 系统 重新 启动 时 进行 。 
11.1.2 事务 的 特性 


事务 具有 四 个 特性 : 原子 性 〈Atomicity)、 一 致 性 〈Consistency)、 隔 离 性 〈Isolation) 和 
(Durability)。 这 四 个 特性 通常 被 称 为 事务 的 ACID 特性 ， 这 一 缩写 取 自 四 个 特性 的 英文 首 字 
母 。 事 务 四 个 特性 含义 如 下 所 述 。 
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(1) 原子 性 (Atomicity): 事务 的 所 有 操作 在 数据 库 中 要 么 全 做 要 么 全 都 不 做 。 如 银行 转 
账 中 的 两 个 操作 必须 作为 一 个 单位 来 处 理 ， 不 能 只 执行 部 分 操作 。 

(2) 一 致 性 〈Consistency): 一 个 事务 独立 执行 的 结果 ， 将 保持 数据 的 一 致 性 ， 即 数据 不 
会 因为 事务 的 执行 而 遭受 破坏 。 数 据 的 一 致 性 是 对 现实 世界 的 真实 状态 的 描述 ， 如 银行 转账 业 
务 执行 后 也 应 该 是 账目 平衡 的 。 数 据 库 在 运行 过 程 中 会 出 现 瞬 间 的 不 一 致 状态 ， 如 从 A 账户 减 
去 x 元 到 给 B 账户 加 上 x 元 之 前 这 段 时 间 数 据 是 不 一 致 , 但 这 种 不 一 致 只 能 出 现在 事务 执行 过 
程 中 ,并且 不 一 致 的 数据 不 能 被 其 他 事务 所 访问 。 一致 性 可 以 由 DBMS 的 完整 性 约束 机 制 来 自 
动 完 成 ， 而 复杂 的 事务 则 由 应 用 程序 来 完成 。 

(3) 隔离 性 (Isolation): 一 个 事务 的 执行 不 能 被 其 他 事务 干扰 。 并 发 事务 在 执行 过 程 中 可 
会 对 同一 数据 进行 操作 ， 这 些 事务 的 操作 应 该 不 会 相互 干扰 ， 是 相互 隔离 的 。 如 事务 执行 中 
数据 不 一 致 性 状态 出 现时 不 能 让 其 他 事务 读 取 到 不 一 致 的 数据 。 

(4) 持久 性 Durability): 一 个 事务 一 旦 提交 ， 它 对 数据 库 的 改变 必须 是 永久 的 ， 即 便 系 
统 出 现 故 障 时 也 是 如 此 。 如 转账 事务 执行 成 功 后 ，A、B 两 个 账户 上 的 余额 就 是 一 个 新 的 值 ， 
在 没有 出 现下 一 个 事务 对 其 修改 之 前 一 直 保 持 不 变 , 即使 系统 出 现 故 障 , 也 应 该 恢复 到 这 个 值 。 

【 例 11.1】 事务 是 一 个 操作 序列 ， 这 些 操 作 _Q〉》_。“ 当 多 个 事务 并 发 执行 时 ， 任 何 一 个 
事务 的 更 新 操作 直到 其 成 功 提 交 前 的 整个 过 程 ， 对 其 他 事务 都 是 不 可 见 的 .” 这 一 性 质 通常 被 
称 为 事务 的 _〈2)_ 性质。 

(1) A. “可 以 做 ， 也 可 以 不 做 ” 是 数据 库 环 境 中 可 分 割 的 逻辑 工作 单位 

B. “可 以 只 做 其 中 的 一 部 分 ” 是 数据 库 环境 中 可 分 割 的 逻辑 工作 单位 
C. “要 么 都 做 ， 要 么 都 不 做 ”， 是 数据 库 环 境 中 可 分 割 的 逻辑 工作 单位 
D. “要 么 都 做 ， 要 么 都 不 做 ”， 是 数据 库 环境 中 不 可 分 割 的 逻辑 工作 单位 

(2) A. 原子 性 B. 一 致 性 C. 隔离 性 D. 持久 性 

例题 分 析 : 空 〈1) 的 正确 选项 为 D。 因 为 ， 事 务 是 一 个 操作 序列 ， 这 些 操作 “要 么 都 做 ， 
要 么 都 不 做 ” 是 数据 库 环境 中 不 可 分 割 的 逻辑 工作 单位 。 空 〈2) 的 正确 选项 为 C。 因 为 ， 选 
项 C“ 隔 离 性 ”符合 题 干 说 明 。 


11.1.3 事务 的 状态 


1. 概述 


如 果 不 出 现 故 障 ， 那 么 所 有 事务 的 都 能 执行 完成 。 一 旦 在 执行 过 程 中 发 生 故 障 、 不 能 
执行 完成 的 事务 称 之 为 中 止 事务 ;将 中 止 事 务 对 数据 库 的 更 新 被 撤销 称 为 事务 回 滚 ; 成 功 
执行 完成 的 事务 称 为 已 提交 事务 。 


的 责任 。 已 提交 的 事务 是 不 能 回 滚 的 


才能 撤销 提交 的 事务 对 数据 库 的 影响 。 

注意 : 事务 一 旦 提交 ， 就 不 能 中 止 它 ， 而 要 撤销 已 提交 事务 所 造成 影响 的 唯一 方法 是 
执行 一 个 补偿 事务 ‘Compensating Transaction)， 比 如 一 个 事务 给 账户 A 加 了 600 元 ， 其 补 
偿 事 务 是 对 账户 A 减 去 600 元 。 实 际 上 不 是 总 能 够 创建 这 样 的 补偿 事务 。 


2. 事务 状态 
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中 止 的 事务 是 可 以 回 滚 的 ， 通 过 回 滚 恢复 数据 库 ， 保 持 数据 库 的 一 致 性 ， 这 是 DBMS 
必须 由 程序 员 或 DBA 手工 执行 一 个 “补偿 事务 ” 


事务 是 数据 库 的 基本 执行 单元 。 事 务 的 执行 情况 有 两 种 可 能 : 一 种 情况 是 事务 成 功 执行 ， 


数据 库 进 入 一 个 新 的 一 致 状态 ， 另 一 种 情况 是 事务 因为 故障 或 其 他 原因 未 能 够 成 功 执行 ， 但 已 
经 对 数据 库 作 了 修改 。 未 能 成 功 执行 的 事务 极 有 可 能 导致 数据 库 处 于 不 一 致 状态 ， 这 时 候 就 需 


要 对 未 能 成 功 执行 的 事务 ( 
如 果 中 止 事务 造成 的 变更 已 
成 功 完成 的 事务 称 为 已 


的 状态 ， 即 使 出 现 系统 故障 ， 
用 执行 一 个 称 为 “补偿 事务 ”的 方法 来 撤销 。 


撤销 它 造成 的 影响 ， 必 须 采 
1) 事务 的 五 种 状态 


为 了 更 明确 地 描述 事务 的 执行 过 程 ， 


种 状态 之 一 。 事 务 各 种 状态 


经 撤销 ， 就 称 事务 已 回 


提交 


这 个 状态 必须 保持 。 


含义 说 明 如 下 。 


也 称 中 止 事务 造成 的 变更 进行 撤销 操作 (也 称 回 深 ROLLBACK)。 


滚 。 


有 务 。 对 数据 库 进 行 更 新 的 已 提交 的 任务 使 数据 库 进 入 一 个 新 


男 一 方面 ， 成 功 提交 的 事务 必 能 通过 中 止 来 


一 般 将 事务 的 执行 状态 分 为 五 种 ， 事 务必 须 处 于 这 五 


(1) 活动 状态 : 事务 的 初始 状态 ， 事 务 执行 时 处 于 这 个 状态 。 

(2) 部 分 提交 状态 : 当 操 作 序 列 的 最 后 一 条 语句 自动 执行 后 ， 事 务 处 于 部 分 提交 状态 。 这 
时 ， 事 务 虽 然 已 经 完全 执行 ， 但 由 于 实际 输出 可 能 还 临时 驻 留 在 内 存 中 ， 在 事务 成 功 完成 前 仍 
有 可 能 出 现 硬件 故障 , 事务 仍 有 可 能 不 得 不 中 止 。 因此 ,部 分 提交 状态 并 不 等 于 事务 成 功 执行 。 

(3) 失败 状态 ， 由 于 硬件 或 逻辑 等 错误 ， 使 得 事务 不 能 继续 正常 执行 ， 事务 就 进入 了 失败 状 


态 ， 处 于 失败 状态 的 事务 必 


须 回 滚 。 这 样 ， 事 务 就 进入 了 中 止 状态 。 


(4) 中 止 状 态 : 事务 回 滚 并 且 数 据 库 恢复 到 事务 开始 执行 前 的 状态 。 
(5) 提交 状态 : 当 事 务 成 功 完成 后 ， 称 事务 处 于 提交 状态 。 只 有 事务 处 于 提交 状态 后 ， 才 


能 说 事务 已 经 提交 。 
2) 事务 的 状态 转换 


事务 的 状态 转换 如 图 11-1 所 示 。 
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END 
TRANSACTION 
BEGIN 
TRANSACTION 


图 11-1 事务 的 状态 转换 图 


事务 状态 转换 操作 命令 如 表 11-1 所 示 ， 可 以 通过 在 事务 中 执行 相关 操作 ， 实 现 事 务 状态 
的 转换 。 


表 11-1 事务 状态 转换 操作 
功能 说 阴 

开始 运行 事务 ， 使 事务 进入 活动 状态 
说 明 事务 中 的 所 有 读 写 操作 都 已 完成 ， 使 事务 进入 部 分 提交 状态 ， 把 
事务 的 所 有 操作 对 数据 库 的 影响 存 入 数据 库 
标志 事务 已 经 成 功 地 完成 ， 事 务 中 的 所 有 操作 对 数据 库 的 影响 已 经 安 
全 地 存 入 数据 库 ， 事 务 进入 提交 状态 ， 结 束 事务 的 运行 
标志 事务 进入 失败 状态 ， 系 统 撤销 事务 中 所 有 操作 对 数据 库 和 其 他 事 
务 的 影响 ， 结 束 事务 的 运行 


操作 
BEGIN -TRANSAIION 


END -TRANSATION 


COMMIT -TRANSACTION 


ABORT -TRANSACTION 


需要 说 明 的 是 ， 事 务 进入 中 止 状 态 后 ， 系 统一 般 有 如 下 两 种 选择 。 
(1) 重启 事务 。 当 事务 中 止 的 原因 是 由 软 、 硬 件 错误 引起 而 不 是 由 事务 内 部 逻辑 错误 所 产 
生 时 ， 一 般 采 用 重启 事务 的 方法 。 重 启事 务 可 以 被 看 作成 一 个 新 事务 。 
(2) 杀 死 事务 。 这 样 做 通常 是 因为 事务 中 止 的 原因 是 由 于 事务 内 部 的 逻辑 造成 的 错误 ， 或 
者 是 由 于 输入 错误 ， 也 可 能 是 由 于 所 需 数据 在 数据 库 中 没 找到 等 原因 。 


11.2 ”数据 库 的 并 发 控制 


所 谓 并 发 操作 ， 是 指 在 多 用 户 共享 的 系统 中 ， 许 多 用 户 可 能 同时 对 同一 数据 进行 操作 。 
发 操作 带 来 的 问题 是 数据 的 不 一 致 性 ， 主 要 有 三 类 : 丢失 更 新 、 不 可 重复 读 和 读 脏 数据 。 其 主 
要 原因 是 事务 的 并 发 操作 破坏 了 事务 的 隔离 性 。DBMS 的 并 发 控制 子 系统 负责 协调 并 发 事务 的 
执行 ， 保 证 数据 库 的 完整 性 不 受 破坏 ， 避 免 用 户 得 到 不 正确 的 数据 。 


| 


六 
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11.2.1 事务 调度 

1， 串 行 调度 
串 行 调度 〈serial schedule) 是 指 多 个 事务 依次 串 行 执行 ， 且 只 有 当 一 个 事务 的 所 有 操作 都 
执行 完 后 才 执行 另 一 个 事务 的 所 有 操作 。 

我 们 考虑 一 个 简单 的 银行 数据 库 系统 。 设 每 个 账号 在 数据 库 中 具有 一 条 数据 库 记 录 ， 用 以 
记录 这 个 账号 的 存款 数量 和 其 他 信息 。 设 有 两 个 事务 Tu 和 Ti， 事 务 To 从 账号 A 转 2000 元 到 
账号 B; 事务 Ti 从 账号 A 转 20% 的 款 到 账号 B。To 和 Ti 的 定义 如 图 11-2 所 示 。 


read(A); i read(A); 
A:=A-2000; i temp:=A*0.2; 
write(A); i A:=A-temp; 
read(B); i write(A); 
B:=B+2000; 让 read(B); 
write(B). ! B:=B+temp; 

i write(B). 


图 11-2 银行 转账 举例 
假设 用 A 和 B 表示 账号 A 和 账号 B 的 存款 数量 ; A、B 的 初 值 为 10000 和 20000。 如 果 这 
两 个 事务 串 行 执行 ， 可 以 有 两 种 调度 方案 。 调 度 S1 是 先 执行 To 后 执行 Ti， 如 图 11-3(a) 所 示 。 


时 间 To Ti T0 TI 
tl read(A) read(A); 
中 A:=A-2000: fonp A 0 
3 | witeay: ed 
t4 read(B): read(B) 
ts || B=B+t2000 | Dtenib 
t6 write(B). . 四 
t7 | read(A); | write(B) 
t8 temp:=A*0.2; read(A) | 
t9 | A:=A -temp; A:=A-2000; i 
t10 i Write(A): write(A); ! 
t1l § read(B); read(B); 上 
t12 i B:=B+temp; B:=B+2000; | 
t13 { write(B) write(B). i 

(a) 调度 S1: 先 To 后 Ti (b) 调 度 S2: 先 TI 后 To 


图 11-3 事务 的 串 行 调度 
运行 结束 时 , A 和 B 的 最 终 值 分 别 是 6400 和 23600。 调度 S2 是 先 执行 Ti 后 执行 To， 如 图 11-3 


:oo 娄 
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(b) 所 示 。 运 行 结束 时 ，A 和 了 的 最 终 值 分 别 是 6000 和 24000。 无 论 采 用 两 种 方案 的 任 一 种 ， 
A+B 在 两 个 事务 执行 结束 时 仍然 是 10000+20000。 


从 上 面 的 例子 可 以 看 出 ， 不 论 是 先 执行 To 后 执行 Ti， 


行 调度 ， 执 行 的 结果 都 是 稳定 的 和 正确 的 。 对 于 


2. 并 发 调度 


并 发 调度 (Concurrent Schedule): 利用 分 时 的 方法 同时 处 理 
对 于 N 个 事务 进行 并 发 调度 ， 


还 是 先 执行 Ti 后 执行 To， 只 要 是 串 
N 个 事务 ， 最 多 有 N! 种 正确 的 串 行 调度 。 


多 个 事务 。 


情况 会 变 得 复杂 得 多 ， 它 的 调度 方案 远大 于 N! 个 ， 而 且 并 


发 调度 的 结果 有 可 能 是 错误 的 。 图 11-4 (a) 调度 S3 是 一 个 并 发 调度 ， 其 执行 的 结果 与 串 行 调 


度 执 行 的 结果 相同 ， 


则 称 这 个 并 发 调度 是 正确 的 。 图 11-4 (b) 调度 S4 也 是 一 个 并 发 调度 ， 但 


其 导致 A、B 的 最 终结 果 为 8000 和 24000，A+B=8000+24000 取 30000， 这 个 结果 是 错误 的 。 我 


们 称 此 并 行 调度 将 产生 不 一 致 状态 。 

时 间 To | T To T 

tl read(A) read(A) 

t2 A:=A -2000; A:=A -2000; 

t3 write( A): read(A); 

t4 read(A); temp:=A*0.2; 

ts temp:=A*0.2; A:=A -temp; 

t6 i A:=A-temp; wnite(A); 

ty write(A); read(B); 

t8 read(B); write(A): 

to9 B:=B+2000; read(B); | 

t10 write(B). B:=B+2000: 

t11 read(B):; write(B). | 

t12 B:=B+temp: | B=B+temp; 

t13 write(B) { write(B) 
(a) 调度 S3: 正确 的 调度 (b) 调度 S4: 错误 的 调度 

图 11-4 事务 的 并 发 调度 
3. 可 恢复 调度 


若 事务 Ti 提交 失败 , 则 应 当 


撤销 Ti 的 影响 以 保证 其 原子 性 。 在 允许 并 发 执行 的 系统 中 ， 


还 必须 确保 依赖 于 Ti 的 任何 事务 五 也 中 止 。 例 


例如 ， 


就 先 于 To 提交 。 假 设 To 在 提交 前 发 生 故障 ， 由 


保证 事务 的 


如 ,Tj 要 读 T 写 的 数据 ， 则 称 T 依 赖 于 Ti。 


图 11-5 所 示 的 调度 示例 。 假 设 系统 允许 Ti 执行 完 read(A) 后 立即 提交 ， 则 T， 


于 Ti 依赖 To CT 要 读 Te 写 的 数据 )， 为 了 


原子 性 必须 中 止 Ti 的 提交 。 但 本 题 允 许 Ti 执行 完 read(A) 后 立即 提交 ， 导 致 To 
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发 生 故 障 后 不 能 正确 恢复 的 情景 。 


read(A) 
write(A) 


i read(A) 
{ /*COMMIT*/ 


read(B) 
/*ROLLBACK*/ 


图 11-5 不 可 恢复 的 调度 举例 


可 恢复 调度 (Recoverable Schedule) 应 满足 ， 当 事务 Ti 要 读 事务 Ti 写 的 数据 时 ， 事 务 
Ti 必须 要 先 于 事务 Tj 提 交 。 

【 例 11.2】 某 银行 信息 系统 有 两 项 业务 对 应 的 事务 T1、T2 与 存款 关系 有 关 。 其 中 ， 转 账 
业务 : TI (A，B，50)， 从 账户 A 向 账户 B 转 50 元; 计 息 业 务 : T2， 对 当前 所 有 账户 的 余额 
计算 利息 ， 余 额 为 X*1.01。 针 对 上 述 业 务 流程 ， 回 答 下 列 问 题 : 

(1) 若 当前 账户 A 余额 为 100 元 ， 账 户 B 余额 为 200 元 。 有 两 个 事务 分 别 为 T1 (A，B， 
50)，T2。 可 能 的 串 行 执行 为 : T1 一 T2 或 T2 一 T1， 请 计算 串 行 执行 结果 。 

(2) 若 上 述 两 个 事务 的 一 个 并 发 调度 顺序 如 图 11-6 所 示 ， 请 问 调 度 是 否 正 确 ， 为 什么 ? 


TI (A, B, 50) 2 
Read(A) 
Read(A) 
Write(A) 
Read(B) 
Write(B) 
Read(B) 
Write(B) 


图 11-6 事务 T1、T2 的 调度 顺序 


解 : (1) T1 一 T2 结果 为 : A=50.5 B=252.5 A+B=303 
T2 一 Tl 结果 为 : A=51 B=252 A+B =303 
(2) 调度 不 正确 , 因为 根据 A、B 的 初 值 , 按照 给 定 的 调度 , 获得 执行 结果 为 : A= 50.5、 
B = 252 与 任何 一 个 串 行 执 行 的 结果 都 不 同 ， 故 为 错误 的 调度 ， 事 实 上 会 造成 储户 的 无 端 损失 。 
11.2.2 ”并 发 操作 带 来 的 问题 


并 发 操作 带 来 的 数据 不 一 致 性 有 三 类 : 丢失 修改 、 不 可 重复 读 和 读 脏 数据 。 对 并 发 操作 带 
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来 的 三 类 数据 不 一 致 性 举例 说 明 如 图 11-7 所 示 。 
1. 丢失 修改 


如 图 11-7 (a) 所 示 ， 事 务 T 、T, 都 是 对 数据 A 做 减 1 操作 。 事 务 Ti 在 时 刻 t 把 A 修改 
后 的 值 15 写 入 数据 库 , 但 事务 T, 在 时 刻 乌 再 把 它 对 A 减 1 后 的 值 15 写 入 。 两 个 事务 都 是 对 A 
的 值 进 行 减 1 操作 并 且 都 执行 成 功 ， 但 A 中 的 值 却 只 减 了 1。 现实 的 例子 如 售票 系统 ， 同 时 售 
出 了 两 张 票 ， 但 数据 库 里 的 存 票 却 只 减 了 一 张 ,造成 数据 的 不 一 致 。 原 因 在 于 T 事务 对 数据 库 
的 修改 被 T? 事务 覆盖 而 丢失 了 ， 破 坏 了 事务 的 隔离 性 。 


时 间 Tl T2 Tl | 严 


| i T 


read( O1001C | 


read(A)[16] read(A)[50] 


tb read(B)[100] =Cr2D00 | 
t C=A+B[150] write(C)[200] | 
ta | read(B)[100] | read(C)[200] 
ts || write(A)T15] | B=B*2[200] 
te | write(B)[200] 
ty | ROLLBACK 
ts read(A)[50] (C=100) 
to read(B)[200] 
tio C=A+B[250] 
ti (验算 不 对 ) 
(a) 丢失 修改 (b) 不 可 重复 读 (c) 读 脏 数据 
图 11-7 三 种 数据 不 一 致 性 举例 
2. 不 可 重复 读 


如 图 11-7 (b) 所 示 ， 事 务 Ti 读 取 A、B 的 值 后 进行 运算 ， 事务 T, 在 ts 时 刻 对 B 的 值 做 了 
修改 以 后 ,事务 Ti 又 重新 读 取 A、B 的 值 再 运算 ， 同 一 事务 内 对 同一 组 数据 的 相同 运算 结果 不 
同 ， 显 然 与 事实 不 相符 。 同 样 是 事务 T 干扰 了 事务 Ti 的 独立 性 。 


3. 读 脏 数据 


如 图 11-7〈c) 所 示 ， 


务 Ti 对 数据 C 修改 之 后 ， 在 ty 时刻 事务 T, 读 取 修 改 后 的 C 值 做 


dh 
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处 理 ， 之 后 事务 Ti 回 滚 ， 数 据 C 恢复 了 原来 的 值 ， 事 务 Tz 对 C 所 做 的 处 理 是 无 效 的 ， 它 读 的 
是 被 丢掉 的 垃圾 值 。 
通过 以 上 三 个 例子 ， 在 事务 并 行 处 理 的 过 程 中 ， 因 为 多 个 事务 对 相同 数据 的 访问 ,干扰 了 
其 他 事务 的 处 理 ， 产 生 了 数据 的 不 一 致 性 ， 是 事务 隔离 性 的 破坏 而 破坏 了 一 致 性 。 

问题 的 焦点 在 于 事务 在 读 写 数据 时 不 加 控制 而 相互 干扰 。 解 决 问题 的 方法 是 从 如 何 保证 事 
务 的 隔离 性 入 手 。 


11.2.3 ”并 发 调度 的 可 串 行 性 
数据 库 系统 必须 控制 事务 的 并 发 执行 以 保证 数据 库 处 于 一 致 性 状态 。 
1， 可 串 行 化 的 调度 


多 个 事务 的 并 发 执行 是 正确 的 ， 当 且 仅 当 其 结果 与 某 一 次 序 串 行 地 执行 它们 时 的 结果 相 
同 ， 称 这 种 调度 策略 是 可 串 行 化 的 调度 (Serializability Schedule ) 。 

可 串 行 性 是 并 发 事务 正确 性 的 准则 ， 按 这 个 准则 规定 ， 一 个 给 定 的 并 发 调度 ， 当 且 仅 当 它 
是 可 串 行 化 的 才 认 为 是 正确 调度 。 


2， 冲 突 可 串 行 化 


冲突 (Conflict): 当 工 和 天 是 不 同事 务 在 相同 的 数据 项 上 操作 的 命令 , 且 至 少 有 一 个 是 write 
命令 时 ， 则 称 开 与 是 冲突 的 。 

考虑 某 调度 S 中 含有 分 别 属于 事务 T;、T; 的 两 条 命令 I、5 〈i 么 j)。 若 下 工分 别 访问 不 同 
的 数据 项 ， 则 交换 I、 5 的 执行 次 序 不 会 影响 调度 执行 的 结果 。 若 If 工分 别 访问 相同 的 数据 项 ， 
则 开拓 的 执行 次 序 可 能 会 影响 调度 执行 的 结果 。 在 此 只 讨论 read 和 write 命令 对 以 下 四 种 情况 
Ii、 下 是否 可 交换 。 

(1) I=read (D)，IFread (D)。 在 调度 S 中 ，T; 与 T 读 到 的 是 相同 的 数据 D 值 ， 交 换 、 
5 的 执行 次 序 不 会 影响 执行 的 结果 。 

(2) I=read(D)，I=write(D)。 在 调度 S 中 ， 若 工 先 于 执行， 那么 Ti; 没有 读 到 Tj 写 回 
的 D 值 ， 可 见 二 、5 的 执行 次 序 是 非常 重要 的 。 

(3) 到 write (D)，[IFread (D)。 在 调度 S 中 , 的 执行 次 序 是 非常 重要 的 ， 其 原因 与 
(2) 类 似 。 

(4) IF write (D)，[IFwrite (D)。 由 于 5 都 是 写 操作 ，I、5 的 执行 次 序 对 Ti、 了 没有 
影响 ， 但 是 ， 若 调度 S 中 的 下 一 条 命令 是 read (D)， 那 么 读 取 的 值 会 受到 影响 ， 因 为 数据 库 中 
只 保留 了 后 一 条 write 命令 写 入 的 值 。 

等 价 调度 : 设 贡 与 世 是 调度 $S 的 两 条 连续 的 命令 ， 若 三 与 是 不 同事 务 的 命令 且 不 冲突 ， 
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则 可 以 交换 五 与 的 顺序 得 到 一 个 新 的 调度 S*。 我 们 称 S 与 $ 是 等 价 的 。 
例如 ， 考 虑 图 11-4 (a) 调度 S3， 由 于 TT 的 write (A) 与 To 的 read (B) 不 冲突 ， 可 以 将 
Ti 的 write (A) 与 To 的 read (B) 的 执行 次 序 交 换 ， 得 到 另 一 个 等 价 调度 S5， 如 图 11-8 所 示 。 


| 
tl read(A) i 
b A=A-2000: | 
G3 write(A); | 
t4 read(A); 
ts | temp:=A*0.2:; 
t6 上 A:=A -temp; 
t7 read(B); 
tg B:=B+2000; 


ed write(A); 
t10 write(B). 
tl read(B); 
t12 B:=B+temp; 
t13 write(B) 

图 11-8 调度 S5 


继续 依次 交换 非 冲 突 命令 的 执行 顺序 : 

@ To 的 read (B) 与 Ti 的 read (A) 交换 

@ To 的 write (B) 与 Ti 的 write (A) 执行 次 序 交 换 

@ To 的 write (B) 与 Ti 的 read (A) 执行 次 序 交 换 

经 过 上 述 一 系列 交换 后 得 到 的 是 一 个 如 图 11-3 (a) 所 示 的 串 行 调度 S1。 这 也 说 明了 调度 
S3 等 价 于 一 个 串 行 调度 ， 所 以 是 一 个 正确 的 调度 。 请 思考 为 什么 调度 S4 是 一 个 错误 的 调度 。 

冲突 等 价 〈Conflict Equivalent): 如 果 调 度 S 经 过 一 系列 非 冲突 命令 交换 成 S ， 则 称 $ 与 


S 是 冲突 等 价 的 。 
冲突 可 串 行 化 Conflict Serializable): 若 调度 S 与 一 个 品行 调度 S 冲突 等 价 , 则 S 是 冲突 
可 串 行 化 的 。 


3， 冲突 可 串 行 化 判定 


在 设计 并 发 控制 机 制 时 ， 必 须 证 明 该 机 制 产生 的 调度 是 否 可 串 行 化 的 。 为 了 确定 一 个 调度 
S 是 否 可 串 行 化 可 以 通过 $ 构造 一 个 有 向 图 ， 也 称 优先 图 (Precedence Graph)。 该 图 由 G= (V， 
E) 组 成 ， 其 中 : V 是 一 个 顶点 集 ， 由 所 有 事务 组 成 。E 是 一 个 边 集 ， 由 满足 下 述 三 个 条 件 的 边 
Tm 组 成 : 

(1) 在 全 执行 Read(A) 之 前 ，T; 执 行 Write(A)。 

(2) 在 了 执行 Write(A) 之 前 ，Ti 执行 Read(A)。 
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(3) 在 了 执行 Write(A) 之 前 ，Ti 执 行 Write(A)。 

如 果 优 先 图 中 存在 边 T; 一 T;， 则 任何 等 价 于 S 的 串 行 调度 S 中 ，Ti 必 出 现在 了 之 前 。 
例如 ， 调 度 S1〈 参 见 图 11-3 (a)) 优先 图 如 图 11-9 〈a) 所 示 ， 图 中 只 有 一 条 边 To 一 Ti， 
为 To 的 所 有 命令 均 在 Ti 之 前 执行 ， 对 调度 S2〈 参 见 图 11-3 (b)) 优先 图 如 图 11-9 (b) 所 
示 ， 图 中 只 有 一 条 边 Ti 一 To， 意 味 着 Ti 的 所 有 命令 均 在 To 之 前 执行 。 
但 对 调度 S4 〈 参 见 图 11-4 (b)) 优先 图 如 图 11-9 (c) 所 示 ， 由 于 To 执行 Read(A) 先 于 Ti 
执行 Write(A)， 所 以 优先 图 中 有 一 条 边 To 一 TI; 又 因为 Ti 执行 Read(B) 先 于 To 执行 Write(B)， 

所 以 优先 图 中 有 一 条 边 Ti 一 To。 


oo 


El 


(a) 调度 S1 的 优先 图 (b) 调度 S2 的 优先 图 (c) 调度 S4 的 优先 图 
图 11-9 优先 图 举例 
如 果 调 度 S 的 优先 图 中 有 环 ， 则 调度 S 是 冲突 不 可 串 行 化 的 ; 如 果 图 中 无 环 ， 则 调度 S 是 
冲突 可 串 行 化 的 。 


可 见 ， 要 判定 冲突 可 串 行 化 ， 首 先 需要 构造 有 向 图 ， 然 后 调用 环 检测 算法 进行 判定 。 有 关 
环 检 测算 法 可 参见 相关 书籍 。 


11.2.4 ”并 发 控制 技术 


通过 上 面 的 例子 我 们 知道 ， 并 发 事务 如 果 对 数据 读 写 时 不 加 以 控制 ， 会 破坏 事务 的 隔离 性 
和 一 致 性 。 为 了 保持 事务 的 隔离 性 ， 系 统 必 须 对 事务 之 间 的 相互 作用 加 以 控制 ， 最 典型 的 方式 
是 要 求 对 数据 对 象 以 互 斥 的 方式 进行 访问 ， 即 当 一 个 事务 访问 某 个 数据 对 象 时 ， 其 他 事务 都 不 
能 更 新 该 数据 对 象 。 最 常用 的 控制 的 手段 就 是 加 锁 ， 该 方法 是 只 允许 事务 访问 当前 持 有 锁 的 数 
据 项 。 给 数据 对 象 加 锁 的 方式 有 多 种 ， 本 节 只 介绍 两 种 锁 : 排 它 锁 和 共享 锁 。 

排 它 锁 (Exclusive Locks， 简 称 义 锁 ) 也 称 为 写 锁 ， 用 于 对 数据 进行 写 操作 时 进行 锁定 。 
如 果 事 务 T 对 数据 A 加 上 X 锁 后 ， 就 只 允许 事务 T 对 读 取 和 修改 数据 A， 其 他 事务 对 数据 A 
不 能 再 加 任何 锁 ， 从 而 也 不 能 读 取 和 修改 数据 A， 直 到 事务 释放 A 上 的 锁 。 

共享 锁 (Share Locks， 简 称 $ 锁 ) 也 称 为 读 锁 ， 用 于 对 数据 进行 读 操作 时 进行 锁定 。 如 果 
事务 T 对 数据 A 加 上 了 S 锁 后 ， 事 务 T 就 只 能 读数 据 A 但 不 可 以 修改 ， 其 他 事务 可 以 再 对 数 
据 A 加 S 锁 来 读 取 ， 只 要 数据 A 上 有 S 锁 ， 任 何事 务 都 只 能 再 对 其 加 S 锁 读 取 而 不 能 加 和 锁 
修改 


【 例 11.3】 若 事务 TT 对 数据 Di 已 加 排 它 锁 , 事务 T 对 数据 D, 已 加 共享 锁 , 那么 事务 了 对 
数据 D|， (1) ; 事务 TT 对 数据 D,， (2) 
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(1) A. 加 共享 锁 成 功 ， 加 排 它 锁 失败 
B. 加 排 它 锁 成 功 ， 加 共享 锁 失败 
C. 加 共享 锁 、 排 它 锁 都 成 功 
D. 加 共享 锁 、 排 它 锁 都 失败 
(2) A. 加 共享 锁 成 功 ， 加 排 它 锁 失败 
B. 加 排 它 锁 成 功 ， 加 共享 锁 失败 
C. 加 共享 锁 、 排 它 锁 都 成 功 
D. 加 共享 锁 、 排 它 锁 都 失败 
分 析 : 显然 根据 排 它 锁 和 共享 锁 的 定义 ， 空 〈1) 的 正确 选项 为 D， 空 2) 的 正确 选项 为 
A。 分 析 略 。 


11.2.5 ”两 段 锁 协议 


通过 对 数据 加 锁 ， 可 以 限制 其 他 事务 对 数据 的 访问 ， 但 这 会 降低 事务 的 并 发 性 。 如 何在 保 
证 事务 的 一 致 性 的 前 提 下 尽 可 能 地 提高 并 发 性 ， 这 需要 封锁 协议 来 解决 。 封 锁 协 议 是 对 数据 加 
锁 类 型 、 加 锁 时 间 和 释放 锁 时 间 的 一 些 规则 的 描述 。 封 锁 协 议 主要 有 三 级 封锁 协议 ， 以 及 两 段 
锁 协 议 。 

1. 封锁 协议 


封锁 协议 有 三 个 级 别 :一 级 封锁 协议 、 二 级 封锁 协议 和 三 级 封锁 协议 。 具 体 描述 如 下 。 

(1) 一 级 封锁 协议 ;是 事务 T 在 修改 数据 A 之 前 必须 先 对 其 加 X 锁 ， 直 到 事务 结束 才 释 
放 义 锁 。 一 级 封锁 协议 使 得 在 一 个 事务 修改 数据 期 间 ， 其 他 事务 不 能 对 该 数据 进行 修改 ， 只 能 
等 到 该 事务 结束 后 ， 解 决 了 丢失 修改 的 问题 。 

(2) 二 级 封锁 协议 : 是 一 级 封锁 协议 加 上 事务 T 在 读 取 数据 A 之 前 必须 对 其 加 上 S 锁 , 读 
完 后 即 可 释放 S 锁 。 二 级 封锁 协议 使 得 一 个 事务 不 能 读 取 被 其 他 事务 修改 中 的 数据 。 解 决 了 读 
脏 数据 的 问题 。 但 是 ， 如 果 事 务 T 在 读 取 数据 A 之 后 ， 其 他 事务 再 对 A 做 完 修改 ， 事 务 T 再 
读 取 A， 还 会 产生 不 可 重复 读 的 错误 。 
(3) 三 级 封锁 协议 : 是 一 级 封锁 协议 加 上 事务 T 在 读 取 数据 A 之 前 必须 对 其 加 上 S 锁 , 直 
到 事务 结束 才 释 放 S 锁 。 三 级 封锁 协议 使 得 一 个 事务 读 取 数 据 期 间 ， 其 他 事务 只 能 读 取 该 数据 
而 不 能 修改 ， 解 决 了 不 可 重复 读 的 问题 。 


2. 两 段 锁 协议 


(1) 两 段 锁 协 议 (Two-phase Locking Protocol) 
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两 段 锁 协议 是 指 对 任何 数据 进行 读 写 之 前 必须 对 该 数据 加 锁 ; 在 释放 一 个 封锁 之 后 ， 事 务 
不 再 申请 和 获得 任何 其 他 封锁 。 

所 谓 “ 两 段 ” 锁 的 含义 是 : 事务 分 为 两 个 阶段 。 第 一 阶段 是 获得 封锁 ， 也 称 为 扩展 阶段 。 
第 二 阶段 是 释放 封锁 ， 也 称 为 收缩 阶段 。 

例如 : 如 果 事 务 和 T2 的 封锁 序列 如 下 ， 则 Ti 遵守 两 段 锁 协 议 而 Ts 不 遵守 两 段 锁 协议 。 

TT 的 封锁 序列 是 :Slock A ..Slock B...xlock C...Unlock B...Unlock A...Unlock C 

T2 的 封锁 序列 是 : Slock A ...Unlock A...Slock B...xlock C...Unlock C...Unlock B 

为 了 确保 事务 并 行 执行 的 正确 性 , 许多 系统 采用 两 段 锁 协 议 。 同 时 系统 设 有 死 锁 检测 机 制 。 
发 现 死 锁 后 按 一 定 的 算法 解除 死 锁 。 

(2) 两 段 锁 协议 与 可 串 行 化 

如 果 事 务 都 遵循 两 段 锁 协 议 ， 那 么 它们 的 并 发 调度 是 可 串 行 化 的 。 两 段 锁 是 可 串 行 化 的 充 
分 条 件 ， 但 不 是 必要 条 件 。 即 如 果 事务 不 遵循 两 段 锁 协议 ， 那 么 它们 的 并 发 调度 可 能 是 可 串 行 
化 的 ， 也 可 能 是 不 可 串 行 化 的 。 

需要 注意 的 是 采用 两 段 锁 协 议 也 有 可 能 产生 死 锁 , 这 是 因为 每 个 事务 都 不 能 及 时 解除 被 它 
封锁 的 数据 ， 可 能 会 导致 多 个 事务 互相 都 要 求 对 方 已 封锁 的 数据 不 能 继续 运行 。 


3， 活 锁 与 死 锁 


所 谓 活 锁 ， 是 指 当 事务 T1 封锁 了 数据 R， 事 务 T2 请 求 封锁 数据 R， 于 是 T2 等 待 ， 当 T1 
释放 了 R 上 的 封锁 后 , 系统 首先 批准 了 T3 请 求 , 于 是 T2 仍 等 待 , 当 T3 释放 了 R 上 的 封锁 后 ， 
又 批准 了 T4 请 求 ， 依 此 类 推 ， 使 得 T2 可 能 永远 等 待 的 现象 。 

所 谓 死 锁 ， 是 指 两 个 以 上 的 事务 分 别 请 求 封锁 对 方 已 经 封锁 的 数据 ， 导 致 长 期 等 待 而 无 法 
继续 运行 下 去 的 现象 。 


11.2.6 多 粒度 封锁 协议 


1. 封锁 的 粒度 


封锁 对 象 的 大 小 称 为 封锁 的 粒度 。 封 锁 的 对 和 象 可 以 是 逻辑 单元 (如 属性 、 元 组 、 关 系 、 索 
引 项 、 整 个 索引 直至 整个 数据 库 )， 也 可 以 是 物理 单元 〈 如 数据 页 或 索引 页 )。 

封锁 粒度 与 系统 的 并 发 度 和 并 发 控制 的 开销 密切 相关 。 封 锁 的 粒度 越 大 ， 并 发 度 越 小 ， 但 
系统 开销 也 就 越 小 :封锁 的 粒度 越 小 ， 并 发 度 越 高 ， 系 统 开销 也 就 越 大。 

选择 封锁 粒度 时 必须 同时 考虑 封锁 对 象 和 并 发 度 两 个 因素 ， 对 系统 开销 与 并 发 度 进行 权 
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衡 ， 以 求 得 最 优 的 效果 。 一 般 说 来 ， 需 要 处 理 大 量 元 组 的 用 户 事务 可 以 以 关系 为 封锁 对 象 ， 需 
要 处 理 多 个 关系 的 大 量 元 组 的 用 户 事务 可 以 以 数据 库 为 封锁 对 象 ， 而 对 于 一 个 处 理 少量 元 组 的 
用 户 事务 ， 可 以 以 元 组 为 封锁 对 象 以 提高 并 发 度 。 

多 粒度 (Multiple Granularity) 机 制 是 指 通过 允许 各 种 大 小 的 数据 项 并 定义 数据 粒度 的 层 
次 结构 ， 其 中 小 粒度 数据 项 嵌 套 在 大 粒度 数据 项 中 。 对 此 ， 可 以 构造 一 个 粒度 层次 图 ， 粒 度 层 
次 图 像 一 棵 倒置 的 树 ， 故 也 称 多 粒度 树 。 

例如 ， 考 虑 一 个 由 四 层 节点 构成 的 多 粒度 树 ， 该 粒度 树 包括 : 根 节点 、 区 域 类 型 节点 、 文 
件 类 型 节点 和 记录 类 型 节点 ， 如 图 11-10 所 示 。 


图 11-10 多 粒度 树 


最 高 层 是 根 节 点 ， 表 示 整 个 数据 库 ， 其 下 的 节点 是 区 域 类 型 节点 ， 而 数据 库 是 由 这 些 区 域 


组 成 。 
第 二 层 是 区 域 类 型 节点 ， 每 个 区 域 类 型 节点 又 以 文件 类 型 节点 作为 其 子 节点 ， 每 个 区 域 是 
这 些 文件 类 节点 组 成 ， 任 何 文件 都 不 能 处 于 一 个 以 上 的 区 域 中 。 

第 三 层 是 文件 类 型 节点 , 文件 类 型 节点 下 的 是 由 记录 类 型 节点 组 成 ,文件 是 由 作为 其 子 节 
点 的 记录 组 成 。 

第 四 层 〈 最 底层 ) 是 记录 类 型 节点 ， 也 称 叶 节点 。 

粒度 树 中 的 每 个 节点 都 可 以 单独 加 锁 (共享 锁 或 排 它 锁 )。 当 一 个 事务 对 节点 加 锁 时 ， 那 
么 该 事务 也 可 以 同样 类 型 的 锁 隐 含 地 封锁 该 节点 的 全 部 后 代 节 点 。 

例如 ， 假 设 事务 Ti 显 式 地 对 图 11-9 中 的 文件 节点 B 加 排 它 锁 ， 若 事务 T 要 求 封锁 文件 
节点 B; 的 后 代 节点 C3 ， 请 分 析 加 锁 是 否 成 功 ? 

分 析 : 由 于 事务 T 显 式 地 对 文件 节点 B; 加 排 它 锁 ， 则 意味 着 事务 Ti 隐 含 地 对 Bs 的 后 代 
节点 Coa1，Cz2,…，Czk 加 排 它 锁 。 当 Ts 要 求 封锁 文件 节点 B 的 后 代 节 点 C23 ， 由 于 Ti 已 显 式 
地 对 节点 Bs 加 排 它 锁 , 意味 着 节点 C23 也 加 了 排 它 锁 。 当 事务 T 发 出 封锁 C>3 命令 时 , 由 于 Cys 
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并 没有 显 式 加 锁 ， 系 统 必须 从 根 节点 到 节点 Cs 开始 搜索 ， 如 果 发 现 该 路 径 上 的 某 个 节点 的 锁 
与 要 加 锁 的 锁 类 型 不 相 容 ，T, 就 必须 延迟 〈 等 待 )。 

采用 多 粒度 树 的 好 处 是 : 减少 对 后 代 节点 加 锁 的 系统 代价 。 从 上 例 可 见 ， 由 于 事务 Ti 显 
式 地 对 文件 节点 Bs 加 排 它 锁 ， 这 样 事务 Ti 不 用 挨个 对 其 后 代 记录 节点 C1，C2,,…，Czk 加 排 
它 锁 ， 从 而 减少 了 事务 Ti 对 记录 节点 Cyl，C22，…， Cax 加 锁 的 系统 代价 。 


2， 意向 锁 


与 共享 锁 和 排 它 锁 相 关联 的 另 一 种 锁 是 意向 锁 。 若 一 个 节点 加 了 共享 型 意向 锁 (IS)， 那 么 


将 在 树 的 较 低层 进行 显 式 封锁 ， 但 只 能 加 共享 锁 ; 若 

一 个 节点 加 了 排 它 型 意向 锁 IX)， 那 么 将 在 树 的 较 | 这 | ss lemlx| 
低层 进行 显 式 封锁 ， 可 以 加 排 它 锁 或 共享 锁 ; 若 一 个 | | True | True | True | True | False | 
节点 加 了 共享 排 它 型 意向 锁 (SIX)， 则 以 该 节点 为 要 


的 子 树 被 显 式 地 加 共享 锁 。 这 些 锁 类 型 的 相 容 函数 矩 


和 ey 


3， 多 粒度 封锁 协议 11-11 锁 相 容 函 数 和 矩阵 


多 粒度 封锁 协议 (Multiple-granularity Looking Protocol) 允许 多 粒度 树 中 的 每 个 节点 被 独 
立地 加 锁 ， 对 某 节点 加 锁 意 味 着 该 节点 的 所 有 后 代 节点 也 被 加 了 同类 型 的 锁 。 

多 粒度 封锁 协议 采用 这 些 锁 (S、IS、X、I 和 SIX) 可 以 保证 调度 的 可 串 行 性 。 每 个 事务 
T， 要 求 按 如 下 规则 对 节点 Q 加 锁 。 

(1) 事务 T 必须 遵循 图 11-11 所 示 的 锁 相 容 函 数 矩 阵 。 

(2) 事务 T 必须 首先 封锁 根 节点 ， 且 可 以 加 任意 类 型 的 锁 。 

(3) 仅 当 T 当前 对 节点 Q 的 父 节 点 持 有 I 和 IS 锁 时 ，T 对 节点 Q 可 加 8 锁 或 IS 锁 。 

(4) 仅 当 了 T 当前 对 节点 Q 的 父 节点 持 有 IX 和 SIX 锁 时 , 对 节点 Q 可 加 和 锁 、SIX 锁 或 
IX 锁 。 

(5) 仅 当 T 未 曾 对 任何 节点 解锁 时 ，T 可 对 节点 加 锁 ， 即 工 是 两 阶段 的 。 

(6) 仅 当 T 不 持 有 Q 的 子 节点 的 锁 时 ，T 可 对 节点 Q 解锁 。 

注意 : 多 粒度 封锁 协议 要 求 加 锁 按 自 顶 向 下 〈 从 根 到 叶 ) 的 顺序 进行 ， 而 锁 的 释放 则 按 自 
底 向 上 《从 叶 到 根 ) 进行 。 

总 之 ， 并 发 控制 的 方法 还 有 许多 种 。 如 基于 时 间 惟 协议、 基于 有 效 性 检查 协议 、 快 照 隔离 
等 等 ， 详 细 可 参考 相关 书籍 和 资料 ， 在 此 不 做 效 述 。 
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11.2.7 ”案例 分 析 


案例 : 某 航 空 公司 售票 系统 负责 所 有 起 飞 航班 的 机 票 销售 业务 ， 该 公司 设 有 多 个 机 票 销售 
网 点 ， 各 售票 网 点 使 用 相同 的 售票 程序 。 假 设 系统 有 如 下 业务 及 规则 。 
(1) 售票 程序 中 用 到 的 伪 指 令 如 表 11-2 所 示 。 


表 11-2 伪 指令 含义 
伪 指令 | 说 了 明 
R (A, x) | 返回 航班 A 当前 的 剩余 机 票数 给 变量 x 


W (A, x) 当前 数据 库 中 航班 A 的 剩余 机 票数 置 为 x 


(2) 车 某 售票 网 点 一 次 售 出 a 张 航班 A 的 机 票 , 则 售票 程序 的 伪 指 令 序列 为 : R (A, x); W 
(A, x —a)。 
(3) 假设 用 E-SQL 实现 的 机 票 销售 程序 的 一 部 分 (不 完整 )， 如 图 11-12 所 示 。 


EXEC SQL SET TRANSACTION ISOLATION LEVEL SERIALIZABLE 
EXEC SQL SELECT balance INTO :x FROM tickets WHERE flight = "A’; 
printft" 航 班 A 当前 剩余 机 票数 为 : %dw 请 输入 购 票数 : ", x ); 
scanf("%d", &a); 

X=X—a; 
if (x<0) 
EXEC SQL ROLLBACK WORK.; 


printft" 票 数 不 够 ， 购 票 失败 ! "); 
else{ 
EXEC SQL UPDATE tickets SET 
if (SQLCA.sqlcode <> SUCCESS) 
EXEC SQL ROLLBACK WORK; 


else 
(b) 


图 11-12 机票 销 售 程序 
根据 上 述 业 务 及 规则 ， 完 成 下 列 问题 。 
【问题 1 假设 有 两 个 售票 网 点 同时 销售 航班 A 的 机 票 ， 那 么 在 数据 库 服务 器 端 可 能 出 现 
如 下 的 调度 : 
A: Ri(A,x), Ra(A,x), Wi(A,x—1), Wa(A,x—2); 
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B: Ri(A,x), Rs(A,x), W,(A,x—2), Wi(A,x— 1); 

C: Ri(A,x), Wi(A,x—1), Rs(A,x), Ws(A,x—2); 

其 中 Ri(A, x)，Wi(A, x) 分 别 表示 第 i 个 销售 网 点 的 读 写 操作 ， 其 余 类 同 。 

假设 当前 航班 A 剩余 10 张 机 票 ， 请 分 析 上 述 三 个 调度 各 自 执行 完 后 的 剩余 票数 ， 并 指出 
错误 的 调度 及 产生 错误 的 原因 。 

【问题 2】(1) 判定 事务 并 发 执行 正确 性 的 准则 是 什么 ? 如 何 保证 并 发 事务 正确 地 执行 ? 

(2) 采用 相应 的 加 锁 、 解 锁 指令 ， 重 写 售票 程序 的 伪 指 令 序列 ， 以 保证 正确 的 并 

【问题 3】 请 补 全 图 11-12 所 示 空 缺 处 的 代码 。 

案例 分 析 

【问题 1】 分 析 

在 事务 并 发 执行 情况 下 , 不 同 的 调度 可 能 产生 不 同 的 结果 。 针对 两 个 并 发 执行 的 售票 程序 ， 
可 能 会 由 于 事务 相互 影响 从 而 得 到 错误 的 结果 。 

【问题 2】 分 析 

考查 对 事务 并 发 控制 的 相关 知识 的 理解 掌握 。 事 务 并 发 调度 是 否 正确 ， 可 通过 对 非 冲突 命 
令 进行 交 换 ， 最 终 将 并 发 调度 转换 成 与 某 一 串 行 化 调度 相同 ， 则 该 并 发 调度 为 可 串 行 化 调度 ， 
可 串 行 化 调度 被 作为 事务 并 发 执行 正确 性 的 准则 。 

为 保证 可 串 行 化 调度 ， 在 事物 执行 过 程 中 引入 相应 指令 进行 控制 ， 即 两 段 锁 协 议 (2PL)， 
即 对 数据 读 之 前 先 加 读 锁 ， 写 前 加 写 锁 ， 事 务 只 有 获得 相应 的 锁 才 能 操作 数据 ， 加 解锁 过 程 分 
为 两 个 阶段 ， 前 一 阶段 只 能 加 锁 ， 后 一 阶段 只 能 解锁 ， 不 允许 有 交叉 。 两 段 锁 协议 是 保证 并 发 
事务 可 串 行 化 调度 的 充分 条 件 。 
针对 给 出 的 伪 指 令 操作 序列 ， 在 事务 读 取 数据 之 前 加 Slock0 指 令 ， 写 数据 之 前 加 Xlock0 
指令 ， 并 保证 读 / 写 锁 不 交叉 ， 即 满足 两 段 锁 协 议 。 

【问题 3】 分析 

考查 对 2PL 协议 理论 与 SQL 中 的 隔离 级 别 以 及 嵌入 式 SQL 的 编程 实践 。 其 中 ， 空 a) 
要 补充 的 是 嵌入 式 SQL 的 更 新 语句 ; 空 (b) 要 补充 的 是 嵌入 式 SQL 中 的 事务 提交 语句 。 

参考 答案 

【问题 1】 参 考 答案 

调度 A 结果 为 8， 调度 B 结果 为 9， 调度 C 结果 为 7。 

调度 A、B 结果 错误 ， 因 为 破坏 了 事务 的 隔离 性 。 一 个 事务 的 执行 结果 被 另 一 个 所 覆盖 。 

【问题 2】 参 考 答案 

(1) 判定 事务 并 发 执行 正确 性 的 准则 是 满足 可 串 行 化 调度 。 要 保证 并 发 事务 正确 地 执行 ， 


国 2> 若 。 数据库 系统 工程 师 教程 〈 第 3 版 ) 


采用 两 段 锁 协议 (2PL)。 
(2) 重 写 后 的 售票 程序 伪 指 令 序列 : XLock(A);R (A, x);W (A, x— a); Unlock(A); 
【问题 3】 参 考 答案 
空 (a) balance=:x WHERE flight=“A” 
空 (b) EXEC SQL COMMIT WORK 


11. 3 数据 库 的 备份 与 恢复 


在 数据 库 的 运行 过 程 中 ， 难 免 会 出 现 计算 机 系统 的 软 、 硬 件 故障 ， 这 些 故障 会 影响 数据 库 
中 数据 的 正确 性 ， 甚 至 破坏 数据 库 ， 使 数据 库 中 全 部 或 部 分 数据 丢失 。 因 此 ， 数 据 库 的 关键 技 
术 在 于 建立 元 余数 据 ， 即 备份 速 数 据 。 如 何在 系统 出 现 故障 后 能 够 及 时 使 数据 库 恢 复 到 故障 前 
的 正确 状态 ， 就 是 数据 库 恢复 技术 。 


11.3.1 数据 库 系统 故障 种 类 


数据 库 系 统 中 可 能 发 生 的 故障 有 很 多 种 ， 本 小 节 只 讨论 事务 故障 、 系 统 故障 、 介 质 故 障 及 
计算 机 病毒 。 


1， 事 务 故 障 


事务 故障 〈Transaction Failure) 是 由 于 程序 执行 错误 而 引起 事务 非 预 期 的 、 异 常 终止 的 故 
障 。 通 常 有 如 下 两 类 错误 引起 事务 执行 失败 。 

(1) 逻辑 错误 。 如 非法 输入 、 找 不 到 数据 、 溢 出 、 超 出 资源 限制 等 原因 引起 的 事务 执行 
失败 。 

(2) 系统 错误 。 系 统 进入 一 种 不 良 状 态 《〈 如 死 锁 )， 导 致 事务 无 法 继续 执行 。 

对 于 不 可 以 预期 的 错误 应 用 程序 无 法 处 理 ， 是 由 DBMS 系统 来 实现 故障 恢复 的 。 如 非法 
输入 、 运 算 溢出 等 。 非 预期 的 故障 如 非法 输入 是 由 约束 机 制 检查 并 恢复 。 事务 故 障 通常 指 非 预 
期 的 故障 。 
事务 故障 意味 着 事务 没有 达到 预期 的 终点 COMMIT 或 者 显示 ROLLBACK)， 因 此 数据 
库 可 能 处 于 不 正确 状态 。 恢 复 程 序 要 在 不 影响 其 他 事务 的 运行 情况 下 ， 强 行 回 滚 该 事务 ， 即 撤 
销 该 事务 已 经 做 出 的 任何 对 数据 库 的 修改 ， 这 类 恢复 操作 称 为 事务 撤销 (UNDO)。 


2. 系统 故障 


系统 故障 是 指 硬 件 故 障 、 软 件 (如 DBMS、OS 或 应 用 程序 ) 漏洞 的 影响 下 ， 导 致 丢失 了 
内 存 中 的 信息 ， 影 响 正在 执行 的 事务 , 但 未 破坏 存储 在 外 存 上 的 信息 。 这 种 情况 称 为 故障 -停止 
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假设 (Fail-stop Assumption ) 。 
系统 故障 中 止 了 事务 的 执行 过 程 ， 破 坏 了 事务 的 原子 性 ， 由 于 缓冲 区 中 的 内 容 可 能 部 分 已 
写 入 数据 库 ， 系 统 重启 后 数据 库 可 能 处 于 不 一 致 状态 。 


3. 介质 故障 


介质 故障 是 指数 据 库 的 存储 介质 发 生 故障 ， 如 磁盘 损坏 、 有 瞬间 强 磁场 干扰 等 。 这 种 故障 直 
接 破 坏 了 数据 库 ， 会 影响 到 所 有 正在 读 取 这 部 分 数据 的 事务 。 

在 数据 库 的 运行 过 程 中 ， 难 免 会 出 现 计算 机 系统 的 软 、 硬 件 故 障 ， 这 些 故 障 会 影响 数据 库 
中 数据 的 正确 性 ， 甚 至 破坏 数据 库 ， 使 数据 库 中 全 部 或 部 分 数据 丢失 。 因 此 ， 数 据 库 的 关键 技 
术 在 于 建立 见 余 数据 ， 即 备份 数据 。 如 何在 系统 出 现 故 障 后 能 够 及 时 使 数据 库 恢复 到 故障 前 的 
正确 状态 ， 就 是 数据 库 恢 复 技术 。 


11.3.2 ”数据 库 备 份 


事实 上 ， 在 当今 信息 社会 ， 最 珍贵 的 财产 并 不 是 计算 机 软件 ， 更 不 是 计算 机 硬件 ， 而 是 企 
业 在 长 期 发 展 过 程 中 所 积累 下 来 的 业务 数据 。 建 立 网 络 最 根本 的 用 途 是 要 更 加 方便 地 传递 与 使 
用 数据 ,但 人 为 错误 、 硬盘 损 坏 、 电 脑病 毒 、 断 电 或 是 天 灾 人 祸 等 等 都 有 可 能 造成 数据 的 丢失 。 
所 以 应 该 强调 指出 :“ 数 据 是 资产 ， 备 份 最 重要 ”。 应 当 理 解 备份 意识 实际 上 就 是 数据 的 保护 意 
识 ， 在 危机 四 伏 的 网 络 环境 中 ， 数 据 随时 有 被 毁灭 的 可 能 。 系 统 灾 难 的 发 生 ， 不 是 是 否 会 ， 而 
是 迟早 的 问题 。 造 成 系统 数据 破坏 、 丢 失 的 原因 很 多 ， 有 些 还 往往 被 人 们 忽视 。 正 确 分 析 威 胁 
数据 安全 的 因素 ， 及 时 地 备份 数据 ， 能 使 系统 的 安全 防护 更 有 针对 性 。 

数据 转 储 是 将 数据 库 自制 到 另 一 个 磁盘 或 磁带 上 保存 起 来 的 过 程 ， 又 称 为 数据 备份 。 数 据 
的 备份 分 为 静态 转 储 和 动态 转 储 、 海 量 转 储 和 增 量 转 储 。 

(1) 静态 转 储 和 动态 转 储 。 静 态 转 储 是 指 在 转 储 期 间 不 允许 对 数据 库 进 行 任何 存 取 、 修 改 
操作 ; 动态 转 储 是 在 转 储 期 间 人 允许 对 数据 库 进行 存 取 、 修 改 操 作 ， 因 此 ， 转 储 和 用 户 事务 可 并 
发 执行 。 数据 转 储 可 以 由 系统 管理 员 (DBA) 来 操作 , 如 静态 转 储 , 可 以 设 定时 间 计划 由 DBMS 
定时 执行 ， 可 以 在 事务 程序 中 增加 功能 实现 动态 转 储 ， 也 可 以 通过 硬件 系统 的 元 余 磁 盘 阵 列 来 
实现 。 

(2) 海量 转 储 和 增 量 转 储 。 海 量 转 储 是 指 每 次 转 储 全 部 数据 ; 增 量 转 储 是 指 每 次 只 转 储 上 
次 转 储 后 更 新 过 的 数据 。 

(3) 日 志文 件 。 在 事务 处 理 的 过 程 中 , DBMS 把 事务 开始 、 事 务 结束 以 及 对 数据 库 的 插入 、 
删除 和 修改 的 每 一 次 操作 写 入 日 志文 件 。 每 条 记录 包括 的 主要 内 容 有 执行 操作 的 事务 标识 、 操 
作 类 型 、 更 新 前 数据 的 旧 值 〈 插 入 操作 此 项 为 空 )、 更 新 后 的 数据 值 〈 删 除 操作 此 项 为 空 )、 更 
新 日 期 和 更 新 时 间 。 一 旦 发 生 故 障 ，DBMS 的 恢复 子 系统 利用 日 志文 件 撤销 事务 对 数据 库 的 改 
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变 , 回 退 到 事务 的 初始 状态 。 因此 , DBMS 利用 日 志文 件 来 进行 事务 故障 恢复 和 系统 故障 恢复 ， 
并 可 协助 后 备 副本 进行 介质 故障 恢复 。 

(4) 数据 库 镜 像 。 为 了 避免 磁盘 介质 出 现 故障 影响 数据 库 的 可 用 性 , 许多 DBMS 提供 数据 
库 镜 像 功 能 用 于 数据 库 恢复 。 需 要 说 明 的 是 ， 数 据 库 镜像 是 通过 复制 数据 实现 的 ， 但 频繁 地 复 
制 数据 会 降低 系统 的 运行 效果 。 因 此 实际 应 用 中 往往 对 关键 的 数据 和 日 志文 件 镜像 。 


11.3.3 ”数据 库 恢复 


要 使 数据 库 在 发 生 故 障 后 能 够 恢复 ， 必 须 建 立 见 余数 据 ， 在 故障 发 生 后 利用 这 些 元 余数 据 
实施 数据 库 恢复 。 建立 元 余数 据 常 用 的 技术 是 数据 转 储 和 建立 日 志文 件 。 在 一 个 数据 库 系 统 中 ， 
这 两 种 方法 一 般 是 同时 被 采用 的 。 


1. 故障 恢复 的 两 个 操作 


有 了 数据 转 储 和 日 志文 件 ， 就 可 以 在 系统 发 生 故 障 是 进行 恢复 。 故 障 恢复 有 撤销 事务 
(UNDO) 和 重 做 (REDO) 两 个 操作 。 

(1) 撤销 事务 (UNDO) 

所 谓 撤销 事务 是 将 未 完成 的 事务 撤销 ， 使 数据 库 回 复 到 事务 执行 前 的 正确 状态 。 

撤销 事务 的 过 程 ， 反 向 扫描 未 完成 的 事务 日 志 〈 由 后 向 前 扫描 )， 查 找事 务 的 更 新 操作 ; 
对 该 事务 的 更 新 操作 执行 逆 操 作 ， 用 日 志文 件 记录 中 更 新 前 的 值 写 入 数据 库 ， 插 入 的 记录 从 数 
据 库 中 删除 ， 删 除 的 记录 重新 插入 数据 库 中 ; 继续 反 向 扫描 日 志文 件 ， 查 找 该 事务 的 其 他 更 新 
操作 并 执行 操作 直至 事务 开始 标志 。 

(2) 重 做 事务 (REDO) 

所 谓 重 做 事务 (REDO) 是 将 已 经 提交 的 事务 重新 执行 。 

重 做 事务 的 过 程 : 从 事务 的 开始 标识 起 ， 正 向 扫描 日 志文 件 ， 重 新 执行 日 志文 件 登记 的 该 
事务 对 数据 库 的 所 以 操作 ， 直 至 事务 结束 标识 。 


2 故障 恢复 策略 


对 于 不 同 的 故障 ， 采 取 不 同 的 恢复 策略 。 

1) 事务 故障 的 恢复 

事务 故障 是 事务 在 运行 至 正常 终止 点 (SUMMIT 或 ROLLBACK) 前 终止 ， 日 志文 件 只 有 
该 事务 的 标识 而 没有 结束 标识 。 对 这 类 故障 的 恢复 通过 撤销 (UNDO) 产生 故障 的 事务 ， 使 数 
据 库 恢复 到 该 事务 执行 前 的 正确 状态 来 完成 的 。 事 务 恢复 有 如 下 三 个 步骤 。 

步骤 1: 反 向 扫描 文件 日 志 〈 即 从 最 后 向 前 扫描 日 志文 件 )， 查 找 该 事务 的 更 新 操作 。 

步骤 2: 对 事务 的 更 新 操作 执行 逆 操 作 。 
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步骤 3: 继续 反 向 扫描 日 志文 件 ， 查 找 该 事务 的 其 他 更 新 操作 ， 并 做 同样 的 处 理 ， 直 到 事 
务 的 开始 标志 。 
注意 : 事务 故障 的 恢复 由 系统 自动 完成 ， 对 用 户 是 透明 的 。 

2) 系统 故障 的 恢复 

系统 故障 会 使 数据 库 的 数据 不 一 致 ， 原 因 有 两 个 : 一 是 未 完成 的 事务 对 数据 库 的 更 新 可 能 
已 写 入 数据 库 ， 二 是 已 提交 的 事务 对 数据 库 的 更 新 可 能 还 在 缓冲 区 中 没 来 得 及 写 入 数据 库 。 因 
此 恢复 操作 就 是 要 撤销 故障 发 生 时 未 完成 的 事务 ， 重 做 (REDO) 已 提交 的 事务 。 

注意 : 系统 故障 的 恢复 是 在 系统 重启 之 后 自动 执行 的 。 

3) 介质 故障 的 恢复 

介质 故障 由 数据 库 遭 到 破坏 ， 需 要 重 装 数据 库 ， 装 载 故障 前 最 近 一 次 的 备份 和 故障 前 的 日 
志文 件 副本 ， 再 按照 系统 故障 的 恢复 过 程 执行 撤销 和 重 做 来 恢复 。 

注意 : 介质 故障 要 有 系统 管理 员 (DBA) 的 参与 ， 装 入 数据 库 的 副本 和 日 记 文件 的 副本 ， 
再 由 系统 执行 撤销 和 重 做 操作 。 

【 例 11.4】 系 统 重 启 后 ， 由 DBMS 根据 _Q) 对 数据 库 进行 恢复 ， 将 已 提交 的 事务 对 
数据 库 的 修改 写 入 人 硬盘。 输入 数据 违反 完整 性 约束 导致 的 数据 库 故障 属于 _ (2)》_。 

(1) A. 日 志 B. 数据 库 文件 。 C. 索引 记录 D. 数据 库 副本 

(1) A. 系统 故障 B. 事务 故障 C. 介质 故障 D. 网 络 故 障 

分 析 : 空 (1) 正确 的 选项 为 A。 系 统 故 障 由 系统 自动 恢复 ， 任 何 对 数据 库 的 修改 ， 都 必 
须 采 取 先 写 日 志 的 方式 ， 修 改 前 的 数据 和 修改 后 的 数据 都 会 写 入 到 日 志 中 ， 而 且 日 志文 件 写 入 
硬盘 后 才 进行 数据 库 的 更 新 ， 所 以 在 系统 重启 后 ， 可 以 查看 日 志 ， 对 已 提交 的 事务 ， 将 其 更 新 
结果 写 入 到 数据 库 ， 即 保证 了 事务 的 持久 性 。 

空 (2) 正确 的 选项 为 B。 事 务 故 障 是 指 事务 程序 的 执行 引起 的 故障 ， 更 新 程序 的 执行 违 
背 了 完整 性 约束 即 应 属于 此 ;系统 故障 是 指 系统 硬件 〈 存 储 设备 除外 )、 操 作 系统 及 DBMS 的 
故障 所 引起 的 数据 库 运 行 故障 ;介质 故障 是 指 存储 设备 故障 导致 数据 丢失 ;网 络 故障 不 直接 影 
响 数据 库存 储 数据 的 正确 ， 不 属于 数据 库 故 障 。 


11. 4 数据 库 的 安全 性 与 完整 性 


11.4.1 数据 库 的 安全 性 


除了 完整 性 约束 提供 保护 意外 引入 的 不 一 致 性 之 外 ， 数 据 库 中 存储 的 数据 还 要 防止 未 经 授 
权 的 访问 和 恶意 的 破坏 或 修改 。 这 一 节 中 ， 重 点 介绍 数据 误 使 用 或 故意 使 数据 不 一 致 的 一 些 方 
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式 ， 然 后 我 们 给 出 防止 这 些 情 况 的 机 制 。 
1. 安全 性 违例 


恶意 访问 的 形式 主要 包括 : 未 经 授权 读 取 数 据 〈 窃 取信 息 ); 未 经 授权 修改 数据 ;未 经 授 
权 破 坏 数据 。 

数据 库 安全 性 〈Data Base Security) 指 保护 数据 库 不 受 恶意 访问 。 需 要 注意 的 是 彻底 杜绝 
对 数据 库 的 恶意 滥用 是 不 可 能 的 ， 但 是 可 以 通过 提高 那些 企图 在 没有 适当 授权 情况 下 访问 数据 
库 的 代价 ， 以 阻止 绝 大 多 数 这 样 的 访问 企图 。 为 了 保护 数据 库 的 安全 ， 可 以 在 以 下 五 个 层次 上 
采取 安全 性 措施 。 

(1) 数据 库 系统 层次 (Database System)。 数 据 库 系统 的 某 些 用 户 获得 的 授权 可 能 只 允许 
他 访问 数据 库 中 有 限 的 部 分 ， 而 另外 一 些 用 户 获得 的 授权 可 能 允许 他 提出 查询 ， 但 不 允许 他 修 
改 数据 。 保 证 这 样 的 授权 限制 不 被 违反 是 数据 库 系统 的 责任 。 

(2) 操作 系统 层次 (Operating System)。 不 管 数据 库 系 统 多 安全 ， 操 作 系统 安全 性 方面 的 
弱点 总 是 可 能 成 为 对 数据 库 进行 未 经 授权 访问 的 一 种 手段 。 

(3) 网 络 层次 (Network)。 由 于 几乎 所 有 的 数据 库 系统 都 允许 通过 终端 或 网 络 进行 远程 访 
问 ， 网 络 软件 的 软件 层 安全 性 和 物理 安全 性 一 样 重 要 ， 不 管 在 因特网 上 还 是 在 私有 的 网 络 内 。 

(4) 物理 层次 〈Physical)。 计 算 机 系统 所 位 于 的 节点 〈 一 个 或 多 个 ) 必须 在 物理 上 受到 保 
护 ， 以 防止 入 侵 者 强行 间 入 或 暗中 潜入 。 

(5) 人 员 层次 (Human)。 对 用 户 的 授权 必须 格外 小 心 ， 以 减少 授权 用 户 接受 贿赂 或 其 他 
好 处 而 给 入 侵 者 提供 访问 机 会 的 可 能 性 。 

为 了 保证 数据 库 安全 ， 用 户 必须 在 上 述 所 有 层次 上 进行 安全 性 维护 。 如 果 较 低层 次 上 物 
理 层次 或 人 员 层 次 ) 安全 性 存在 缺陷 ， 高 层 安全 性 措施 即使 很 严格 也 可 能 被 绕 过 。 下 面 主 要 在 
数据 库 系统 层次 上 讨论 安全 性 。 主 要 包括 : 权限 机 制 、 视 图 机 制 和 数据 加 密 。 


2. 授权 


通过 DBMA 提供 的 授权 功能 赋予 用 户 在 数据 库 各 个 部 分 上 的 几 种 形式 的 授权 ， 其 中 包括 : 

。 read 授权 允许 读 取 数据 ， 但 不 允许 修改 数据 。 

。 insert 授权 允许 插入 新 数据 ， 但 不 允许 修改 已 经 存在 的 数据 。 

。 update 授权 允许 修改 数据 ， 但 不 允许 删除 数据 。 

。 delete 授权 允许 删除 数据 。 

可 以 赋予 用 户 可 以 获得 上 面 的 所 有 授权 类 型 或 其 中 一 部 分 的 组 合 ， 也 可 以 根本 不 获得 任何 
授权 。 除 了 以 上 几 种 对 数据 访问 的 授权 外 ， 用 户 还 可 以 获得 修改 数据 库 模式 的 授权 : 

。 index 授权 允许 创建 和 删除 索引 。 
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。 resource 授权 人 允许 创建 新 关系 。 

。 alteration 授权 允许 添加 或 删除 关系 中 的 属性 。 

。 drop 授权 允许 删除 关系 。 

drop 授权 和 delete 授权 的 区 别 在 于 delete 授权 只 允许 对 元 组 进行 删除 。 如 果 用 户 删除 了 关 
系 中 的 所 有 元 组 ， 关 系 仍然 存在 ， 只 不 过 是 空 的 。 如 果 关 系 被 删除 ， 那 么 关系 就 不 再 存在 了 。 

可 以 通过 resource 授权 来 控制 创建 新 关系 的 能 力 。 具 有 resource 授权 的 用 户 在 创建 新 关系 
后 自动 获得 该 关系 上 的 所 有 权限 。 

index 授权 看 起 来 似乎 是 不 必要 的 ， 因 为 索引 的 创建 和 删除 不 会 改变 关系 中 的 数据 。 事 实 
上 ， 索 引 是 提高 性 能 的 一 种 结构 。 但 是 ， 索 引 也 会 消耗 空间 ， 并 且 所 有 数据 库 的 修改 都 需要 更 
新 索引 。 如 果 index 授权 被 授予 所 有 用 户 ， 那 么 执行 更 新 操作 的 用 户 倾向 于 删除 索引 ， 而 提出 
查询 的 用 户 倾向 于 创建 大 量 索引 。 为 了 使 数据 库 管理 员 能 够 管理 系统 资源 的 使 用 ， 我 们 有 必要 
将 索引 的 创建 作为 一 种 权限 来 看 待 。 

最 大 的 授权 形式 是 给 数据 库 管 理 员 的 。 数 据 库 管 理 员 可 以 给 新 用 户 授权 , 可 以 重 构 数 据 库 ， 
等 等 。 这 一 授权 形式 类 似 于 操作 系统 中 提供 给 超级 用 户 或 操作 员 的 权限 。 


3. 授权 与 视图 


视图 是 给 用 户 提供 个 性 化 数据 库 模 型 的 一 种 手段 ， 而 且 可 以 隐藏 用 户 不 需要 看 见 的 数据 。 
视图 隐藏 数据 的 能 力 既 可 以 用 于 简化 系统 的 使 用 ， 又 可 以 用 于 实现 安全 性 。 由 于 视图 只 允许 用 
户 关注 那些 感 兴趣 的 数据 ， 它 简化 了 系统 的 使 用 。 尽 管用 户 可 能 不 被 允许 直接 访问 某 个 关系 ， 
但 用 户 可 能 被 允许 通过 一 个 视图 访问 该 关系 的 一 部 分 。 因 此 ， 关 系 级 的 安全 性 和 视图 级 的 安全 
性 可 以 结合 起 来 ， 用 于 限制 用 户 只 能 访问 所 需 数据 。 

例如 ， 银 行 高 管 考虑 一 个 需要 知道 在 各 支行 有 贷款 的 所 有 客户 姓名 的 职员 。 该 职员 不 能 看 
到 与 客户 具体 贷款 相关 的 信息 。 因 此 ， 该 职员 对 loan 关系 的 直接 访问 必须 被 禁止 ， 但 是 ， 如 果 
她 要 访问 所 需 信息 ， 就 必须 得 到 对 视图 cust-loan 的 访问 ， 这 一 视图 由 所 有 客户 姓名 及 其 贷款 支 
行 构成 。 此 视图 可 以 用 SQL 定义 如 下 : 


JR 


create view cust-loan as 
(select branch-name, customer-name 
from borrower, loan 
where borrower.loan-number=loan.loan-number) 


假设 该 职员 提出 如 下 SQL 查询 : 


select* 
from cust-loan 
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显然 ， 该 职员 被 允许 看 到 此 查询 的 结果 。 但 是 ， 当 查询 处 理 器 将 此 查询 转换 为 数据 库 中 的 
事实 关系 上 的 查询 时 ， 它 产生 的 是 borrower 和 loan 上 的 查询 。 因 此 ， 系 统 对 职员 查询 授权 的 检 


查 必须 在 查询 处 理 开 始 之 前 进行 。 
创建 视图 并 不 需要 resource 授权 。 创 建 视图 的 用 户 不 一 定 能 获得 该 视 
得 到 的 权限 不 会 为 他 提供 超过 原 有 授权 的 其 他 授权 .例如 ,在 用 来 定义 视图 


图 上 
的 关 


为 所 有 权限 ， 他 
系 上 没有 update 


授权 的 用 户 不 能 得 到 相应 视图 上 的 update 授权 。 如 果 用 户 创建 一 个 视图 ， 


而 此 


户 在 该 视图 上 


不 能 获得 任何 授权 ， 这 样 的 视图 创建 请 求 将 被 系统 拒绝 。 在 cust-loan 的 例子 中 ， 视 图 的 创建 者 


必须 在 关系 borrower 和 loan 上 都 具有 read 授权 。 
4. 权限 的 授予 


获得 了 某 种 形式 授权 的 用 户 可 能 被 允许 将 此 授权 传递 给 其 他 用 户 。 但 是 ， 对 于 授权 可 能 怎 
样 在 用 户 间 传 递 我 们 必须 格外 小 心 ， 以 保证 这 样 的 授权 在 未 来 的 某 个 时 候 可 以 被 收回 。 
例如 ， 考 虑 银行 数据 库 中 loan 关系 上 update 权限 的 授予 。 假 设 最 初 数据 库 管 理 员 将 loan 


上 的 update 权限 授 给 用 户 U1、U, 和 U3， 他 们 接 下 来 又 可 以 将 授 
权 传 递 给 其 他 用 户 。 授 权 从 一 个 用 户 到 另 一 个 用 户 的 传递 可 以 表 
示 为 授权 图 (Authorization Graph)。 该 图 的 节点 是 用 户 。 如 果 用 户 
Ui 将 loan 上 的 update 权限 授 给 用 户 U;， 则 图 中 包含 边 U; 一 Uj。 图 


U U, 


DBA 一 一 ~ U 一 一 ~ U， 


U; 


的 根 是 数据 库 管理 员 。 图 11-13 给 出 了 一 个 示例 的 图 , 请 注意 用 户 图 11-13 ”权限 授予 图 


U1 和 Uz 都 给 Us 授予 了 权限 ， 而 U4 只 从 Ul 处 获得 了 授权 。 


节点 的 路 径 。 


户 具 有 授权 当 且 仅 当 存在 从 授权 图 的 根 〈 即 代表 数据 库 管理 员 的 节点 ) 到 代表 该 用 户 的 


设 数据 库 管 理 员 决定 收回 用 户 Ui 的 授权 。 由 于 用 户 U4 从 Ui 处 获得 授权 ， 因 此 其 权限 也 
应 该 被 收回 。 可 是 ， 用 户 Us 既 从 Ui 处 又 从 Uz 处 获得 了 授权 。 由 于 数据 库 管 理 员 没 有 从 U2 处 
收回 loan 上 的 update 授权 ，Us 继续 拥有 loan 上 的 update 授权 。 如果 Us 最 后 从 Us 处 收回 授权 ， 


则 Us 失去 授权 。 


狭 独 的 用 户 可 能 企图 通过 相互 授权 来 破坏 权限 回收 规则 ， 如 图 11-14 (a) 所 示 。 


DBA DBA DBA 


(a) (b) (ce) 


图 11-14 破坏 权限 回收 的 企图 
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如 果 数 据 库 管理 员 从 Uz 收回 权限 ，U2 保留 了 通过 Us 获得 的 授权 ， 如 图 11-14 (b) 所 示 。 
如 果 权 限 接着 从 Us 处 收回 ，Us3 似乎 保留 了 通过 U, 获得 的 授权 ， 如 图 11-14 〈c) 所 示 。 
然而 ， 当 数据 库 管 理 员 从 Us 处 收回 权限 时 , 从 Us 到 Uz 的 边 以 及 从 Us 到 Us 的 边 就 不 


日 


是 


从 数据 库 管 理 员 开始 的 路 径 的 一 部 分 了 。 DBA 
为 了 防止 相互 授权 破坏 权限 回收 规则 , 要 求 授权 图 中 的 所 有 边 2 
都 必须 是 某 条 从 数据 库 管理 员 开始 的 路 径 的 一 部 分 。 这样 和 Us Ui 由 由 


之 间 的 边 将 被 删除 ， 不 会 产生 图 11-14(c) 的 情况 。 结 果 授 权 图 如 。 ”图 11-15 结果 授权 图 
图 11-15 所 示 。 


5. 角色 


考虑 一 个 有 很 多 出 纳 的 银行 。 每 一 个 出 纳 必须 对 同一 组 关系 具有 同 种 类 型 的 权限 。 无 论 何 
时 指定 一 个 新 的 出 纳 ， 他 都 必须 被 单独 授予 所 有 这 些 授 权 。 

一 个 更 好 的 机 制 是 指明 所 有 出 纳 应 该 有 的 授权 ， 并 单独 标示 出 哪些 数据 库 用 户 是 出 纳 。 系 
统 可 以 用 这 两 条 信息 来 确定 每 一 个 有 出 纳 身 份 的 人 的 权限 。 当 一 个 人 被 新 雇佣 为 出 纳 时 ， 必 须 
给 他 分 配 一 个 用 户 标 识 符 ， 并 且 必 须 将 他 标示 为 一 个 出 纳 ， 而 不 需要 重新 单独 给 予 出 纳 权 限 。 

角色 (Role) 的 概念 可 用 于 该 机 制 。 在 数据 库 中 建立 一 个 角色 集 ， 和 授予 给 每 一 个 单个 用 
户 一 样 可 将 权限 授予 角色 。 分 配给 每 个 数据 库 用 户 一 些 他 (或 她 ) 有 权 扮 演 的 角色 〈 也 可 能 是 
空 的 )。 

事实 上 ， 在 银行 的 数据 库 里 ， 角 色 的 例子 可 以 包括 system-administrator、branch-manager、 
teller 和 auditor。 一 个 不 是 很 合适 的 方法 是 建立 一 个 teller 用 户 号， 允许 每 一 个 出 纳 用 这 个 出 纳 
用 户 号 来 连接 数据 库 。 该 机 制 的 问题 是 它 无 法 鉴别 出 到 底 哪 个 出 纳 执行 了 事务 ， 从 而 导致 安全 
隐患 。 应 用 角色 的 好 处 是 需要 每 个 用 户 用 自己 的 用 户 号 连接 数据 库 。 

任何 可 以 授予 一 个 用 户 的 权限 都 可 以 授予 一 个 角色 。 给 用 户 分 配角 色 就 跟 给 用 户 授权 
样 。 与 其 他 授权 一 样 ， 一 个 用 户 也 可 以 被 授予 给 他 人 分 配角 色 的 权限 。 这 样 ， 可 以 授予 支行 经 
理 (Branch-manager) 分 配 出 纳 角色 的 权限 。 


6. 审计 追踪 


很 多 安全 的 数据 库 应 用 软件 需要 维护 审计 追踪 (Audit Trail)。 审 计 追 踪 是 一 个 对 数据 库 所 
有 更 改 〈 插 入 /删除 /更 新 ) 的 日 志 ， 还 包括 一 些 其 他 信息 ， 如 哪个 用 户 执行 了 更 改 和 什么 时 候 
执行 的 更 改 等 。 
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审计 追踪 在 几 个 方面 加 强 了 安全 性 。 例 如 ， 如 果 发 现 一 个 账户 的 余额 不 正确 ， 银 行 也 许 会 
希望 跟踪 所 有 在 这 个 账户 上 的 更 新 来 找到 错误 或 欺骗 性 ) 的 更 新 ， 同 时 也 会 找到 执行 这 个 更 
新 的 人 。 然 后 银行 就 可 以 利用 审计 追踪 跟踪 这 些 人 所 做 的 所 有 的 更 新 来 找到 其 他 错误 或 欺骗 性 
的 更 新 。 

可 以 在 关系 更 新 操作 上 定义 适当 的 触发 器 来 建立 一 个 审计 追踪 (利用 标示 用 户 名 和 时 间 的 
系统 变量 )。 然 而 ， 很 多 的 数据 库 系 统 提供 了 内 置 机 制 来 建立 审计 追踪 ， 用 起 来 会 更 加 方便 。 
具体 怎么 建立 审计 追踪 的 细节 随 着 不 同 的 数据 库 系统 而 不 同 ， 通 常 应 该 参考 数据 库 系统 用 户 手 
册 来 了 解 具 体 细节 。 


7. 数据 加 密 


目前 数据 加 密 仍 是 计算 机 系统 对 信息 进行 保护 的 一 种 最 可 靠 的 方法 。 它 利用 密码 技术 对 信 
息 进行 加 密 ， 实 现 信息 隐蔽 ， 从 而 起 到 保护 信息 的 安全 的 作用 。 对 数据 库 中 的 数据 进行 加 密 ， 
可 以 防止 数据 在 存储 和 传输 过 程 中 失 密 。 

按照 作用 的 不 同 ， 数 据 加 密 技术 可 分 为 数据 传输 加 密 技 术 、 数 据 存储 加 密 技 术 、 数 据 完整 
性 的 鉴别 技术 和 密 钥 管理 技术 。 

1) 数据 传输 加 密 技术 

数据 传输 加 密 技术 的 目的 是 对 传输 中 的 数据 流 加 密 , 通常 有 线路 加 密 与 端 - 端 加 密 两 种 。 线 
路 加 密 侧重 在 线路 上 而 不 考虑 信 源 与 信 宿 ， 是 对 保密 信息 通过 各 线路 采用 不 同 的 加 密 密 钥 提供 
安全 保护 。 端 - 端 加 密 指 信息 由 发 送 端 自动 加 密 ， 并 且 由 TCP/IP 进行 数据 包 封装 ， 然 后 作为 不 
可 阅读 和 不 可 识别 的 数据 穿 过 互联 网 ， 当 这 些 信 息 到 达 目 的 地 ， 将 被 自动 重组 、 解 密 ， 而 成 为 
可 读 的 数据 。 

2) 数据 存储 加 密 技术 

数据 存储 加 密 技术 的 目的 是 防止 在 存储 环节 上 的 数据 失 密 ， 数 据 存储 加 密 技术 可 分 为 密 文 
存储 和 存 取 控 制 两 种 。 前 者 一 般 是 通过 加 密 算 法 转换 、 附 加 密码 、 加 密 模 块 等 方法 实现 ， 后 者 
则 是 对 用 户 资格 、 权 限 加 以 审查 和 限制 ， 防 止 非法 用 户 存 取 数 据 或 合法 用 户 越权 存 取 数 据 。 

3) 数据 完整 性 鉴别 技术 

数据 完整 性 鉴别 技术 的 目的 是 对 介入 信息 传送 、 存 取 和 处 理 的 人 的 身份 和 相关 数据 内 容 进 
行 验证 ， 一 般 包 括 口令 、 密 钥 、 身 份 、 数 据 等 项 的 鉴别 。 系 统 通过 对 比 验证 对 象 输入 的 特征 值 
是 否 符合 预先 设 定 的 参数 ， 实 现 对 数据 的 安全 保护 。 

4) 密 钥 管 理 技术 

密 钥 管 理 技术 包括 密 钥 的 产生 、 分 配 、 保 存 、 更 换 和 销毁 等 各 个 环节 上 的 保密 措施 。 
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11.4.2 ”数据 库 的 完整 性 


数据 库 的 完整 性 是 指数 据 的 正确 性 和 相 容 性 。 如 学 生 的 性 别 只 能 是 男 或 女 ， 百 分 制 的 成 绩 
只 能 取 0 到 100 的 整数 值 等 。 为 防止 错误 数据 进入 数据 库 ' DBMS 提供 了 完整 性 约束 机 制 ， 通 
过 对 数据 库 表 结构 进行 约束 ， 当 对 数据 进行 修改 时 由 系统 对 修改 数据 进行 完整 性 检查 ， 将 错误 
数据 拒绝 于 数据 库 之 外 。 
完整 性 约束 条 件 作用 的 对 象 可 以 是 表 、 行 和 列 三 种 。 列 级 约束 主要 是 对 列 的 类 型 、 取 值 范 
围 、 精 度 、 非 空 值 、 值 不 可 重复 等 的 约束 条 件 。 行 级 约束 是 记录 字段 值 之 问 联系 的 约束 条 件 ， 
如 余额 应 该 等 于 存 入 金额 减 去 支出 金额 的 差 值 。 表 级 约束 是 表 的 主 码 约 束 、 表 与 表 间 的 参照 完 
整 性 约束 、 表 中 记录 间 的 联系 约束 ， 如 部 门 最 高 工资 不 能 大 于 本 部 门 平均 工资 的 5 倍 。 

列 级 约束 、 主 码 约束 、 参 照 完整 性 约束 是 在 数据 库 定义 过 程 中 定义 的 ， 并 和 数据 库 定义 的 
其 他 信息 存储 在 数据 字典 中 。 在 标准 SQL 的 DDL 语言 提供 了 这 种 功能 ， 其 他 的 相对 复杂 的 约 
束 需 要 编写 触发 器 〈Trigger) 程序 实现 。 

在 事务 程序 对 数据 库 进 行 修改 时 ， 对 于 数据 库 定义 的 约束 , 由 DBMS 提供 的 完整 性 约束 机 
制 来 检查 ， 如 果 不 符合 约束 条 件 则 拒绝 修改 并 给 出 提示 。 对 于 触发 器 程序 编制 的 约束 ， 由 触发 
器 机 制 执行 程序 来 实现 约束 。 
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本 章 主要 介绍 传统 关系 型 数据 库 之 外 的 一 些 数据 库 发 展 相关 的 新 方向 和 新 技术 ， 分 别 是 分 


布 式 数据 库 、 与 Web 相关 的 数据 库 技术 、 
数据 库 ， 以 及 非 关系 型 数据 库 NoSQL。 


12.1 ”分 布 式 数据 库 


XML 与 数据 库 、 面 向 对 象 数据 库 、 决 策 支持 系统 与 


分 布 式 数据 库 系统 是 数据 库 系 统 和 计算 机 网 络 相 结合 的 产物 。 一 方面 ， 由 于 计算 机 功能 增 
强 ， 成 本 下 降 ， 几 乎 每 个 办 公 室 、 实 验 室 ， 个 人 用 户 都 可 以 拥有 自己 的 计算 机 ， 从 而 增加 了 数 
据 分 散 处 理 的 需求 。 另 一 方面 ， 由 于 通信 技术 的 迅速 发 展 ， 出 现 了 各 种 计算 机 网 络 ， 降 低 了 数 
据 传输 费用 ， 而 计算 机 局 部 网 络 的 广泛 应 用 ， 则 为 分 布 式 数据 库 系 统 的 出 现 提供 了 实现 的 可 


能 性 。 


分 布 式 数据 库 系 统 的 研制 ， 经 历 了 一 个 艰难 而 曲折 的 过 程 。 最 初 由 IBM 和 UNIVAC 等 设 


计 单 位 提出 在 APAC 和 CYCLADES 计划 


中 发 展 起 来 的 技术 , 只 实现 了 分 布 式 系统 的 信息 通信 。 


关于 分 布 式 环 境 中 的 信息 存储 、 分 配 、 交 换 以 及 处 理 等 问题 均 没有 得 到 妥善 的 解决 ， 这 说 明 在 


集中 式 数据 库 系 统 中 所 使 用 的 传统 技术 ， 


是 不 够 的 ， 必 须根 据 分 布 式 系统 的 特殊 要 求 ， 对 实现 技术 作 重 新 的 考虑 。 


对 于 解决 上 述 问题 已 经 不 再 适用 。 因 此 ， 简 单 的 移植 


自 1975 年 以 来 ， 美 国 、 法 国 、 德 国 等 国家 的 许多 大 学 、 科 研 单位 都 在 研究 分 布 式 数据 库 


领域 里 的 各 种 问题 ， 力 图 实现 分 布 式 数据 库 系 统 。 随 着 对 各 种 理论 问题 研究 的 进展 ， 以 及 人 人 


对 分 布 式 数据 库 系 统 认识 的 深化 ， 


一 些 国家 的 政府 也 先后 拟订 了 发 展 这 一 领域 的 计划 ， 如 美国 


的 SDD-1 计划 、 法 国 的 CIRIUS 计划 、 德 


系统 等 。 


分 布 式 数据 库 系 统 的 必要 性 是 显而易见 的 ， 在 一 个 各 场地 有 数据 库 的 计算 机 网 络 系统 中 ， 


若 有 分 布 式 数据 库 管 理 系统 ， 则 可 使 系统 


柏林 工业 大 学 的 VDN 系统 和 斯 图 加 特大 学 的 POREL 


中 的 数据 库 实现 共享 ,利用 率 高 ， 存 取 快 ,可 靠 性 高 ， 


用 户 使 用 这 些 数 据 库 如 同 使 用 本 地 数据 库 一 样 ， 极 为 方便 。 反 之 ， 若 没有 分 布 式 数据 库 管理 系 
统 ， 只 利用 现 有 的 一 般 网 络 操作 系统 来 存 取 网 络 中 数据 ， 凡 使 用 过 这 类 系统 的 用 户 都 会 感到 相 
当 麻 烦 和 困难 ， 而 且 这 类 系统 在 如 何 保证 在 有 一 定数 据 见 余 〈 这 是 获得 可 靠 性 所 需要 的 ) 情况 
下 保证 数据 的 一 致 性 ， 故 障 点 的 自动 切除 和 故障 后 的 恢复 以 及 并 发 控制 等 问题 就 更 没有 保障 
了 。 所 以 , 研制 各 种 性 能 优良 的 分 布 式 数据 库 系统 ,无 论 是 同 构 还 是 异 构 型 ， 都 是 极为 必要 的 。 


分 布 式 数 据 库 系 统 将 广 
货 公 司 销售 点 的 经 营销 售 信 


息 系 统 ， 大 规模 数据 资源 如 人口 普查 、 气 象 预报 、 环 境 污染 、 地 震 上 


挥 控制 系统 ， 具 有 多 数据 处 


泛 用 于 各 企 事业 单位 的 人 事 、 财 务 和 
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库存 控制 等 管理 信息 系统 ， 百 
息 处 理 系统 ， 电 子 银行 等 的 在 线 处 理 系统 ， 国 家 政府 部 门 的 经 济 信 
监测 等 数据 库 系 统 ， 军 事 指 
理 中 心 的 企业 报告 生产 系统 ， 医 院 的 病历 药品 管理 以 及 辅助 诊断 、 


病人 监护 系统 ， 工 业 控制 和 管理 的 集散 型 系统 ， 计 算 机 综合 自动 化 制造 系统 以 及 各 种 办 公 自 动 


12.1al 


要 使 数据 库 系 统 能 够 正 
正常 运行 策略 和 非 正 常 运行 
1， 正 常 运行 策略 


分 布 式 数据 库 系统 (Distributed Database System，DDBS) 是 针对 面向 地 


上 又 需要 不 同 程度 集中 管理 
库 的 定义 之 前 ， 我 们 先 来 看 


可 以 看 出 ， 分 布 式 数据 


‘ Cpevs | Govs | 


分 布 式 数据 库 的 概念 


常 运 行 ， 必 须 制订 运行 策略 ， 运 行 策 略 的 制订 要 从 两 个 方 
策略 。 


考虑 : 


理 上 分 散 ， 而 管理 
的 需求 而 提出 的 一 种 数据 管理 信息 系统 。 在 明确 地 给 出 分 布 式 数据 
一 下 一 般 的 分 布 式 数据 库 系统 的 组 成 ， 如 图 12-1 所 示 。 


‘Cpavs [aaavs | 


12-1 分 布 式 数据 库 系统 组 成 图 


库 系统 首先 是 由 多 个 不 同 节点 或 场地 的 数据 库 系 统 通 过 网 络 连接 而 
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成 的 (如 不 加 特别 说 明 ， 本 章 中 的 场地 和 节点 表示 同一 含义 )， 每 个 节点 都 有 各 自 的 数据 库 管 
理 系 统 (Local Database Management System，LDBMS )， 同 时 还 有 全 局 数据 库 管 理 系统 (Global 
Database Management System，GDBMS)。 图 12-1 中 的 局 部 用 户 是 针对 某 一 个 节点 而 言 的 ， 局 
部 用 户 只 关心 他 所 访问 的 节点 上 的 数据 ， 而 全 局 用 户 则 可 能 需要 访问 多 个 节点 上 的 数据 。 每 个 
节点 的 LDBMS 完成 对 局 部 用 户 的 应 用 请 求 ，GDBMS 则 为 全 局 用 户 提供 服务 。 我 们 还 可 以 看 
出 ， 全 局 用 户 可 以 从 任意 一 个 节点 访问 分 布 式 数据 库 系 统 中 的 数据 。 
在 一 个 计算 机 网 络 中 ， 每 个 节点 都 装 有 数据 库 系 统 ， 节 点 数据 虽然 达到 共享 ， 但 如 果 没有 
统一 的 管理 ， 对 于 用 户 来 说 ， 使 用 数据 库 数 据 时 必须 指明 数据 库 所 在 场地 的 位 置 ， 无 法 实现 场 
也 透明 性 ， 就 达 不 到 分 布 式 数据 库 的 目标 。 如 果 只 在 计算 机 网 络 中 某 一 场地 设置 数据 库 系 统 ， 
其 他 场地 不 设 数据 库 系 统 ,而 是 有 多 个 终端 (远程 用 户 ， 显 然 又 达 不 到 数据 分 散 存储 的 目标 。 
所 以 分 布 式 数 据 库 至 少 应 该 有 场地 透明 性 和 分 散 存储 两 个 特点 。 

另外 ， 因 为 分 布 式 数 据 库 系统 作为 一 个 整体 ， 应 该 保证 数据 的 一 致 性 ， 这 就 意味 着 分 布 式 
数据 库 系统 中 的 各 个 局 部 数据 库 之 间 应 该 具有 逻辑 相关 性 。 根 据 上 面 的 这 些 特点 ， 我 们 给 出 分 
布 式 数据 库 的 定义 。 

满足 下 面条 件 的 数据 库 系 统 被 称 为 完全 分 布 式 数据 库 系统 。 

(1) 分 布 性 : 即 数据 存储 在 多 个 不 同 的 节点 上 。 

(2) 逻辑 相关 性 : 即 数 据 库 系统 内 的 数据 在 逻辑 上 具有 相互 关联 的 特性 。 

(3) 场地 透明 性 : 即使 用 分 布 式 数据 库 中 的 数据 时 不 需 指 明 数 据 所 在 的 位 置 。 

(4) 场地 自治 性 : 即 每 一 个 单独 的 节点 能 够 执行 局 部 的 应 用 请 求 。 

分 布 式 数据 库 系 统 的 分 布 性 可 以 让 我 们 区 分 单一 的 集中 式 数据 库 与 分 布 式 数据 库 ， 而 根据 
逻辑 相关 性 ， 我 们 就 可 以 将 分 布 式 数据 库 与 一 组 局 部 数据 库 或 存储 在 计算 机 网 络 中 不 同 节点 的 
文件 系统 区 分 开 来 。 场 地 透明 性 和 场地 的 自治 性 则 可 以 和 多 机 处 理 系 统 或 并 行 系统 区 分 开 来 。 


2， 分 布 式 数据 库 的 特点 


分 布 式 数 据 库 系统 ， 是 传统 集中 式 数据 库 系 统 的 发 展 ， 因 此 它 具 有 集中 式 数据 库 系 统 的 特 
点 。 同 时 ， 由 于 它 的 分 布 性 而 又 使 这 些 特点 具有 新 的 含义 。 传 统 的 数据 库 系统 针对 文件 系统 的 
弱点 ， 采 用 了 集中 控制 以 实现 数据 共享 ， 这 是 其 最 主要 的 特色 。 对 于 分 布 式 数据 库 系 统 来 说 ， 
于 数据 的 分 散 性 ， 分 布 式 数据 库 系统 具有 分 散 与 集中 的 统一 的 特性 。 下 面 给 出 了 分 布 式 数据 
库 的 几 个 主要 的 特点 。 

1) 数据 的 集中 控制 性 

能 够 对 信息 资源 提供 集中 控制 ， 是 主张 采用 数据 库 最 强 有 力 的 动机 之 一 。 数 据 库 是 随 着 信 
息 系统 的 演变 而 发 展 起 来 的 ， 在 这 些 信息 系统 中 ， 每 个 应 用 程序 都 有 自己 的 专用 文件 ， 这 样 就 
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不 利于 数据 的 管理 和 共享 ， 由 于 数据 本 身 已 被 当 作 企业 的 重要 投资 ， 在 这 样 的 需求 推动 下 ， 传 
统 的 数据 库 系统 孕育 而 生 。 分 布 式 数据 库 系 统 是 在 传统 数据 库 系 统 的 基础 上 的 新 发 展 ， 所 以 ， 
它 也 具有 集中 控制 的 特性 。 

在 传统 的 数据 库 系 统 中 ， 数 据 库 管 理 员 (Database Administrator ，DBA) 的 基本 任务 是 保 
证 数据 的 安全 ， 并 负责 对 数据 进行 管理 以 达到 用 户 和 应 用 能 够 高 效 地 访问 数据 。 而 在 分 布 式 数 
据 库 中 可 以 认为 存在 全 局 数据 库 管理 员 和 局 部 数据 库 管 理 员 ， 这 是 一 种 分 层 控制 结构 ， 一 般 来 
说 ， 全 局 数据 库 管理 员 负责 管理 所 有 数据 库 ， 而 局 部 数据 库 管理 员 只 负责 各 自 节点 的 局 部 数据 
库 , 但 是 在 有 些 情况 下 , 局 部 数据 库 管理 员 可 以 有 更 高 的 自主 性 , 甚至 完成 节点 间 的 协调 工作 ， 
从 而 不 再 需要 全 局 数据 库 管理 员 。 

2) 数据 独立 性 

数据 独立 性 也 是 集中 式 数据 库 和 文件 系统 相 比 所 具有 的 一 大 特征 ， 独 立 性 是 指数 据 的 组 成 
对 应 用 程序 来 说 是 透明 的 。 应 用 程序 只 需要 考虑 数据 的 逻辑 结构 , 而 不 用 考虑 数据 的 物理 存放 ， 
因而 数据 在 物理 组 织 上 的 改变 不 会 影响 应 用 程序 。 
在 分 布 式 数据 库 系统 中 ， 数 据 的 独立 性 同样 具有 重要 的 意义 ， 分 布 式 数据 库 的 数据 独立 性 
除了 有 具有 传统 意义 上 数据 独立 性 的 含义 ， 还 有 分 布 式 透明 的 含义 ， 所 谓 分 布 式 透明 是 指 : 虽然 
应 用 程序 所 面 对 的 是 分 散 存放 的 数据 ， 但 就 像 使 用 集中 式 数 据 库 一 样 ， 不 必 考 虑 数据 库 的 分 布 
特性 


3) 数据 见 余 可 控 性 
将 数据 组 织 在 数据 库 中 可 以 方便 地 实现 数据 的 共享 ， 因 此 要 尽量 减少 数据 元 余 ， 这 不 仅 使 
存储 代价 降低 ， 还 可 提高 查询 效率 ， 便 于 数据 一 致 性 维护 ， 这 是 数据 库 系统 优 于 文件 系统 特点 
之 一 。 但 是 ， 对 数据 库 系统 来 说 ， 也 不 可 能 达到 绝对 的 无 元 余数 据 。 

对 于 分 布 式 数据 库 来 说 ， 由 于 数据 存储 的 分 散 性 ， 各 场地 在 网 络 上 需要 传输 数据 ， 与 集中 
式 数据 库 相 比 ， 查 询 中 就 增加 了 传输 代价 。 因 此 ， 分 布 式 数据 库 中 的 数据 一 般 存 储 在 经 常 使 用 
的 场地 上 ， 但 两 个 或 两 个 以 上 的 场地 应 用 对 同一 数据 有 存 取 要 求 也 是 时 常 发 生 的 ， 而 且 当 传输 
代价 高 于 存储 代价 时 ， 可 以 将 同一 数据 存储 在 两 个 (甚至 更 多 ) 场地 上 ， 以 节省 传输 的 开销 。 
另外 ， 数 据 有 多 个 副本 ， 也 可 以 提高 系统 的 可 用 性 ， 即 当 系统 中 某 个 节点 发 生 故障 时 ， 因 为 数 
据 有 其 他 副本 在 非 故 障 场地 上 ， 对 其 他 所 有 场地 来 说 ， 数 据 仍然 是 可 用 的 ， 从 而 保证 数据 的 完 
备 性 。 由 于 这 种 元 余 度 是 在 系统 控制 之 下 的 ， 所 以 给 系统 造成 的 不 利 影响 是 可 控制 的 。 

另外 ， 由 于 可 用 副本 的 存在 也 相应 地 提高 了 场地 的 自治 性 。 

4) 场地 自治 性 
在 分 布 式 数据 库 系统 中 ， 多 个 场地 的 局 部 数据 库 在 逻辑 上 集成 为 一 个 整体 ， 这 个 整体 被 称 
为 全 局 数据 库 ， 并 为 分 布 式 数据 库 系统 的 所 有 用 户 使 用 ， 这 种 应 用 称 为 分 布 式 数据 库 的 全 局 应 
用 ， 其 用 户 为 全 局 用 户 ; 同时， 分 布 式 数 据 库 系统 还 允许 用 户 只 使 用 本 地 的 局 部 数据 库 ， 这 种 
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应 用 为 局 部 应 用 ， 其 用 户 为 局 部 用 户 ， 甚 至 局 部 用 户 所 使 用 的 数据 可 以 不 参与 到 全 局 数据 库 中 
去 。 这 种 局 部 应 用 独立 于 全 局 应 用 的 特性 就 是 局 部 数据 库 的 自治 性 。 
于 自治 性 ， 对 每 个 场地 来 说 就 有 两 种 数据 ， 一 种 是 参与 全 局 数据 库 的 局 部 数据 ， 而 另 一 
种 则 是 不 参与 全 局 数据 库 的 数据 。 

5) 存 取 的 有 效 性 

在 传统 的 数据 库 系统 中 ， 采 用 二 次 索引 、 文 件 链接 等 复杂 的 存储 结构 是 提高 存 取 效 率 的 主 
要 方法 。 但 在 分 布 式 数据 库 系统 中 ， 仅 仅 采用 复杂 的 存 取 结构 并 不 是 一 个 正确 的 方法 。 分 布 式 
数据 库 系 统 中 的 全 局 查询 被 分 解 成 等 效 的 子 查询 ， 即 全 局 查询 的 执行 计划 分 解 成 多 个 子 查询 执 
行 计划 加 以 执行 ， 它 是 根据 系统 的 全 局 优化 策略 产生 的 ， 而 子 查询 计划 又 是 在 各 场地 上 分 布 执 
行 的 。 因而， 分布 式 数据 库 系统 中 查询 优化 有 两 个 级 别 :全 局 优化 和 局 部 优化 。 

全 局 优化 主要 决定 在 多 个 副本 中 选取 合适 的 场地 副本 ， 使 得 场地 间 的 数据 传输 量 传输 次 数 
最 少 ， 从 而 使 系统 通信 开销 少 。 而 局 部 优化 就 和 传统 的 集中 式 数据 库 中 的 优化 是 一 致 的 了 。 


12.1.2 “分 布 式 数据 库 的 体系 结构 


1， 分 布 式 数据 库 的 模式 结构 


我 国 在 多 年 的 研究 与 开发 分 布 式 数据 库 及 制定 我 国 的 《分 布 式 数据 库 系统 标准 》 中 ， 曾 提 
出 把 分 布 式 数据 库 抽象 为 四 层 的 模式 结构 ， 参 见 图 12-2。 


全 局 外 层 


全 局 概念 模式 
全 局 概念 层 


念 局 部 概 4 


局 部 概念 模式 


局 部 概念 模式 局 部 概念 模式 
局 部 内 模式 局 部 内 模式 局 部 内 模式 


a 
局 部 数据 库 局 部 数据 库 局 部 数据 库 


图 12-2 分 布 式 数据 库 结 构 模式 图 
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这 种 四 层 模式 划分 为 : 全 局 视图 、 全 局 概念 层 、 局 部 概念 层 和 局 部 内 层 。 在 各 层 间 还 有 相 
应 的 层 间 映射 。 四 层 模 式 的 划分 不 仅 适用 于 完全 透明 的 分 布 式 数据 库 系统 ， 而 且 也 适合 各 种 透 
明 性 要 求 的 分 布 式 数据 库 系 统 。 无 论 是 对 同 构 型 分 布 式 数据 库 系 统 ， 还 是 异 构 型 分 布 式 数 据 库 
系统 都 能 适用 。 

1) 全 局 外 层 

分 布 式 数据 库 是 一 组 分 布 的 局 部 物理 数据 库 的 逻辑 集合 。 分 布 式 数据 库 的 全 局 视图 如 同 集 
中 式 数 据 库 一 样 ， 由 多 个 用 户 视图 组 成 。 用 户 视图 是 针对 分 布 式 数据 库 特 定 的 全 局 用 户 的 ， 是 
对 分 布 式 数据 库 的 最 高 层 的 抽象 。 

分 布 式 数 据 库 与 集中 式 数 据 库 的 视图 有 同样 的 概念 ， 不 同 的 是 ， 它 不 是 从 某 一 个 具体 场地 
上 的 局 部 数据 库 中 抽取 , 而 是 从 一 个 虚拟 的 由 各 局 部 数据 库 罗 辑 集合 中 抽取 , 对 全 局 用 户 而 言 ， 
不 论 他 在 分 布 式 数据 库 系 统 中 的 哪 一 个 节点 上 访问 系统 中 的 数据 ， 都 可 以 认为 所 有 的 数据 库 都 
在 本 场地 ， 而 且 他 只 关心 他 们 自己 所 使 用 的 那 部 分 数据 。 

如 果 是 完全 透明 的 关系 模型 的 分 布 式 数据 库 结构 ， 则 视图 就 和 集中 式 数据 库 的 视图 一 样 ， 
其 定义 方式 也 基本 相同 ， 因 此 全 局 用 户 在 使 用 视图 时 ， 就 不 必 关 心 数据 的 分 片 和 具体 的 物理 细 
节 。 若 为 非 完全 透明 的 分 布 式 数据 库 ， 则 在 视图 定义 中 ， 根 据 透明 性 支持 的 程度 ， 需 要 给 出 一 
定 的 数据 细节 、 物 理 存 取 的 细节 等 。 

2) 全 局 概念 层 

全 局 概念 层 是 分 布 式 数据 库 的 整体 抽象 ， 包 含 了 系统 中 全 部 数据 的 特性 和 逻辑 结构 。 就 像 
集中 式 数据 库 中 概念 视图 一 样 ， 是 对 数据 库 的 整体 的 描述 ， 但 在 分 布 式 数据 库 的 四 层 抽象 的 结 
构 中 ， 全 局 概念 层 比 集中 式 的 概念 层 有 更 多 的 描述 。 

从 分 布 透明 特性 来 说 ， 分 布 式 数据 库 的 全 局 概念 层 应 具有 三 种 模式 描述 信息 。 

(1) 全 局 概念 模式 ， 描 述 分 布 式 数据 库 全 局 数据 的 逻辑 结构 ， 是 分 布 式 数据 库 的 全 局 概念 
视图 。 与 集中 式 数据 库 的 概念 视图 的 定义 相似 ， 全 局 概念 模式 应 包含 模式 名 、 属 性 名 以 及 每 种 
属性 的 数据 类 型 的 定义 和 长 度 。 

(2) 分 片 模式 ， 描 述 全 局 数据 逻辑 划分 的 视图 ， 它 是 全 局 数据 的 逻辑 结构 根据 某 种 条 件 的 
划分 ， 每 一 个 逻辑 划分 即 是 一 个 片段 或 称 为 分 片 。 

(3) 分 配 模 式 ， 描述 局 部 逻辑 的 局 部 物理 结构 ， 是 划分 后 的 片段 〈 或 分 片 ) 的 物理 分 配 视 
图 。 它 与 集中 式 数 据 库 物 理 存储 结构 的 概念 不 同 ， 是 全 局 概念 层 的 内 容 。 

分 布 式 数据 库 的 定义 语言 除了 需要 提供 概念 模式 的 定义 语句 外 ， 还 必须 提供 分 片 模式 和 分 
配 模式 的 定义 语句 。 

从 全 局 模式 到 分 片 模式 ， 再 到 分 配 模式 ， 它 们 之 间 存 在 着 映射 。 全 局 概念 模式 到 分 片 模式 
的 映射 是 一 对 多 的 ， 即 一 个 全 局 概念 模式 有 若干 个 分 片 模式 与 之 相对 应 ， 而 一 个 分 片 模式 只 能 
对 应 一 个 全 局 概念 模式 。 分 片 模式 到 分 配 模式 映射 可 以 是 一 对 多 的 或 者 一 对 一 的 ， 这 是 由 数据 
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分 布 的 元 余 策略 所 决定 。 当 采用 一 对 多 时 ， 表 明 分 片 数据 有 多 个 副本 存储 在 不 同 的 场地 上 ， 且 
同一 场地 一 般 情况 下 不 允许 有 相同 的 副本 存在 ， 当 采用 一 对 一 时 ， 则 表明 数据 是 非 元 余 的 ， 即 
分 片 数 据 只 有 一 个 副本 。 

从 全 局 概念 层 观察 分 布 式 数据 库 ， 它 定义 了 全 局 数据 的 逻辑 结构 、 罗 辑 分 布 性 和 物理 分 布 
性 ， 但 并 不 涉及 全 局 数据 在 每 个 局 部 场地 上 的 物理 存储 细节 。 所 以 全 局 概念 层 ， 仍 然 是 概念 层 
视图 ， 或 全 局 数据 库 管 理 员 视图 ， 因 而 ， 全 局 数据 库 管理 员 将 负责 全 局 数据 结构 的 定义 、 轴 辑 
分 布 的 定义 和 物理 分 布 的 定义 。 

分 布 式 数据 库 的 全 局 数据 分 布 性 的 描述 对 关系 数据 模型 最 为 有 利 。 对 于 关系 型 分 布 式 数据 
库 来 说 ， 全 局 概念 模式 由 一 组 全 局 关系 模式 的 定义 组 成 ， 分 片 模式 是 对 全 局 关系 模式 的 逻辑 划 
分 定义 ， 即 片段 定义 ， 或 子 关系 模式 定义 组 成 ， 所 以 可 以 将 片段 看 作 是 全 局 关系 的 逻辑 组 成 ， 
即 逻 辑 片 段 ， 分 配 模式 是 对 于 子 关系 模式 的 描述 ， 因 此 分 配 模 式 决定 了 子 关系 的 物理 场地 ， 即 
决定 子 关系 的 物理 片段 。 

如 图 12-3 所 示 是 全 局 关系 R 的 分 片 和 物理 映像 示意 图 。 全 局 关系 R 分 为 三 个 片段 R1、R2 
和 R3， 以 匈 余 的 方式 分 配 到 不 同 物理 节点 上 。R1 在 节点 1 和 节点 2 有 相同 的 映像 ，R2 只 在 节 
点 上 存储 ，R3 在 节点 1、 节 点 2 和 节点 3 上 都 有 相同 的 映像 副本 。 


全 局 关系 片段 物理 映像 


R1 


节点 1 


R3 


节点 2 


R3 节点 3 


12-3 ”全 局 关系 的 各 片段 和 物理 映像 示意 图 


3) 局 部 概念 层 
局 部 概念 层 由 局 部 概念 模式 描述 ， 一 般 情况 下 ， 它 是 全 局 概念 模式 的 子 集 ， 全 局 概念 模式 
经 逻辑 划分 后 被 分 配 在 各 局 部 场地 上 。 
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在 分 布 式 数 据 库 局 部 场地 上 ， 每 个 全 局 关系 有 该 全 局 关系 的 若干 个 (可 允许 是 全 部 ) 逻辑 
片段 的 物理 片段 集合 ， 该 集合 是 一 个 全 局 关系 在 某 个 局 部 场地 上 的 物理 映像 ， 全 部 的 物理 映像 
组 成 局 部 概念 模式 。 如 果 两 个 场地 上 的 所 有 物理 映像 都 相同 ， 则 其 中 一 个 场地 上 的 数据 必然 是 
另 一 个 场地 的 副本 ， 两 个 场地 的 局 部 概念 模式 亦 相 同 。 

如 果 分 布 式 数据 库 只 支持 全 局 应 用 ， 则 局 部 概念 模式 可 理解 为 局 部 数据 库 的 概念 模式 和 外 
模式 ， 在 此 情况 下 ， 外 模式 和 概念 模式 是 相同 的 ;如 果 分 布 式 数据 库 还 支持 局 部 用 户 ， 而 局 部 
用 户 定义 的 局 部 数据 不 参与 分 布 式 数据 库 的 全 局 数据 ， 则 局 部 概念 层 还 应 划分 为 局 部 外 模式 和 
局 部 模式 ， 并 且 由 局 部 DBA 描述 ， 这 些 将 不 属于 全 局 概念 模式 。 这 时 值得 注意 的 是 ， 全 局 数 
据 和 局 部 数据 的 管理 分 别 由 全 局 DBA 和 局 部 DBA 管理 。 因 此 ,全 局 用 户 是 否 可 以 使 用 全 局 数 
据 则 由 全 局 DBA 授权 ， 局 部 DBA 无 权 授予 全 局 用 户 各 种 权限 。 

当 全 局 数据 模型 与 局 部 数据 模型 不 同时 ， 则 物理 映像 与 各 局 部 数据 库 的 数据 模型 之 间 还 必 
须 有 数据 模型 的 转换 。 即 使 是 数据 模型 相同 时 ， 也 可 能 有 数据 类 型 和 格式 的 各 种 转换 。 也 就 是 
说 ， 各 局 部 数据 库 是 多 种 数据 模型 构成 的 数据 库 时 ， 在 组 成 分 布 式 数据 库 时 ， 需 要 一 个 统一 的 
全 局 描述 ， 即 数据 模型 的 同 种 化 的 集成 ， 而 对 于 不 同 的 规格 化 的 统一 ， 则 称 之 为 一 体 化 。 这 就 
是 分 布 式 数据 库 中 的 全 局 概念 层 到 局 部 概念 层 的 映射 模式 的 描述 。 

4) 局 部 内 层 

局 部 内 层 是 分 布 式 数 据 库 中 关于 物理 数据 库 的 描述 。 相 当 于 集中 式 数 据 库 的 内 层 。 其 描述 
的 内 容 和 方法 与 之 大 致 相同 。 

总 之 ， 分 布 式 数据 库 四 层 结构 及 其 模式 定义 之 间 的 相互 映射 关系 ， 体 现 了 分 布 式 数据 库 是 

组 用 网 络 联结 的 局 部 数据 库 的 逻辑 集合 。 四 层 结构 也 体现 了 分 布 式 数据 库 的 特点 。 

(1) 全 局 数据 库 与 局 部 数据 库 分 离 。 全 局 数据 库 是 虚拟 的 ， 全 局 DBA 的 视图 由 全 局 概念 
层 定义 ， 完 全 独立 于 各 个 场地 的 局 部 数据 库 ， 局 部 概念 层 和 局 部 内 层 可 看 作 是 局 部 数据 库 ， 它 
是 全 局 数据 库 的 内 层 。 这 样 ， 不 论 是 同 构 或 异 构 型 的 分 布 式 数据 库 ， 其 全 局 数据 库 到 局 部 数据 
库 都 是 由 映射 模式 解释 的 ， 所 不 同 的 是 ， 同 构 型 分 布 式 数据 库 比 异 构 型 分 布 式 数据 库 在 映射 模 
式 上 的 复杂 性 较 低 。 而 对 于 全 局 用 户 来 说 ， 他 们 所 关心 的 只 是 外 层 所 定义 的 视图 ， 他 们 只 需 使 
日 全 局 数据 所 提供 的 语言 去 操纵 分 布 式 数据 库 ， 无 须 考虑 各 种 模型 转换 、 语 言 的 转换 、 场 地 分 
配 等 细节 。 全 局 数据 库 与 局 部 数据 库 的 分 开 描述 , 不 仅 体 现 了 本 章 中 关于 分 布 式 数据 库 的 定义 ， 
同时 也 体现 了 它 具有 模式 转换 的 透明 性 。 

(2) 数据 库 的 数据 独立 性 。 四 层 结构 中 的 全 局 外 层 是 数据 库 的 用 户 视图 ， 可 有 多 个 。 全 局 
概念 层 和 局 部 概念 层 是 分 布 式 数据 库 的 全 局 整体 逻辑 数据 和 局 部 整体 逻辑 数据 的 抽象 ， 由 于 分 
布 式 数据 库 的 分 布 特性 决定 了 全 局 整体 逻辑 数据 的 抽象 只 有 一 个 ， 而 局 部 数据 的 逻辑 抽象 则 是 
每 个 局 部 数据 库 各 有 一 个 ， 当 然 也 允许 其 中 的 某 些 逻辑 抽象 完全 相同 ， 这 样 ， 分 布 式 数据 库 就 
具有 了 集中 式 数 据 库 那 样 的 数据 独立 性 一 一 逻辑 数据 独立 性 和 物理 数据 独立 性 。 
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(3) 透明 性 。 在 全 局 概念 层 中 ， 把 数据 的 分 片 概念 和 数据 的 分 配 概 念 分 别 定义 ， 从 而 把 分 
布 透明 中 的 分 片 透明 和 分 配 透 明 相 分 离 。 所 谓 分 片 透明 即 用 户 完全 只 对 全 局 关系 操作 ， 而 不 管 
关系 如 何在 逻辑 上 划分 成 片段 关系 ， 在 全 局 概念 层 把 分 片 透明 看 作 是 最 高 程度 的 透明 性 。 所 谓 
分 配 透明 ， 是 较 低级 的 透明 . 要 求 用 户 在 片段 上 操作 ， 不 是 在 全 局 关系 上 的 操作 ， 但 不 必 考 虑 
片段 的 存放 位 置 ， 对 用 户 而 言 ， 在 完全 透明 的 情况 下， 系统 支持 由 分 片 定义 而 选中 所 需 的 片段 
进行 操作 ， 并 由 系统 选择 出 适当 的 场地 执行 。 从 而 实现 了 对 用 户 的 分 布 完全 透明 。 这 种 分 离 对 
分 布 式 数据 库 设计 是 十 分 有 利 的 ， 可 在 罗 辑 设计 阶段 考虑 分 片 的 划分 要 求 ， 而 在 实现 时 才 考虑 
数据 分 配 问题 。 

(4) 数据 元 余 控制 。 元 余 只 在 分 配 时 才 涉及 ， 并 且 分 布 式 系统 提供 了 重复 副本 透明 性 。 分 
布 式 系统 还 可 提供 比 场地 透明 更 低 一 级 的 透明 性 管理 ， 即 用 户 只 要 指定 某 个 副本 ， 系 统 对 其 他 
副本 完成 相应 的 操作 ， 从 而 保证 所 有 副本 的 完整 性 和 可 用 性 。 


2， 数据 分 布 


数据 分 布 是 分 布 式 数据 库 系 统 中 的 基本 问题 ， 解 决 好 这 个 问题 对 提高 分 布 式 数据 库 系 统 的 
效率 和 性 能 有 积极 的 作用 。 亡 谓 数据 分 布 是 指 在 分 布 式 环境 中 通过 合理 分 布 数 据 ， 提 高 数据 操 
作 自 然 并 行 度 ， 以 达到 最 好 的 执行 效率 的 目的 。 在 构建 分 布 式 数据 库 系统 的 运行 环境 时 ， 必 须 
考虑 数据 如 何 分 布 在 系统 的 各 个 场地 上 ， 或 者 说 ， 必 须 考虑 构成 分 布 式 数据 库 系统 的 各 个 组 成 
部 分 各 自如 何 使 用 数据 的 问题 。 所 以 ， 在 分 布 式 数据 库 系 统 中 ， 同 样 存在 着 分 布 式 数据 库 的 设 
计 间 题 。 数 据 分 布 就 是 讨论 这 个 问题 ， 它 包括 分 布 式 数据 库 的 逻辑 划分 和 物理 分 配 ， 以 及 用 户 
对 分 布 式 数据 库 的 划分 或 分 配 的 感知 程度 〔 透 明度 )。 

数据 分 布 要 研究 的 问题 是 在 分 布 式 数据 库 中 ， 如 何 放 置 数据 ， 从 而 使 得 相关 数据 之 间 的 相 
对 位 置 最 佳 。 

如 何 分 布 数据 ， 使 它们 的 相对 位 置 最 佳 ， 还 需要 考虑 许多 其 他 问题 ， 例 如 : 

(1) 如 果 一 个 场地 上 的 存储 空间 不 够 ， 无 法 存放 要 访问 的 所 有 数据 时 该 怎么 办 ? 

(2) 数据 相对 位 置 对 查询 优化 有 什么 样 的 影响 ? 

(3) 如 何 才 能 知道 相对 位 置 最 佳 的 数据 分 布 是 否 最 大 限度 地 利用 了 网 络 环境 并 行 性 ? 

对 于 数据 分 布 问题 ， 人 们 已 经 进行 了 大 量 的 研究 工作 ， 其 中 主要 的 工作 都 是 围绕 着 两 方面 
进行 的 :“ 高 效 的 数据 划分 问题 ”和 “数据 放置 问题 ”。 第 一 个 方面 是 关于 如 何 把 数据 划分 开 ， 
使 得 使 用 率 最 高 的 数据 能 够 被 放置 在 性 能 最 好 的 场地 上 。 第 二 个 方面 是 关于 如 何 把 已 划分 好 的 
数据 合理 地 放置 在 网 络 上 以 获得 最 好 的 执行 效率 ， 减 少 网 络 传输 的 数据 量 。 数 据 的 划分 和 放置 
是 数据 分 布 问题 的 两 个 方面 ， 只 解决 其 中 任何 一 个 都 不 能 说 是 已 经 解决 了 数据 分 布 问题 。 数 据 
分 布 是 分 布 式 数 据 库 的 特征 ， 解 决 数据 分 布 的 策略 一 般 有 以 下 几 种 。 

(1) 集中 式 : 所 有 全 局 数据 片段 都 安排 一 个 节点 上 。 
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这 种 分 布 策略 把 系统 数据 都 存放 在 一 个 节点 上 ， 对 数据 的 控制 和 管理 都 比较 容易 ， 数 据 的 
一 致 性 和 完整 性 能 够 得 到 保证 。 但 是 由 于 数据 的 检索 和 修改 都 必须 通过 这 个 节点 ， 使 得 这 个 节 
点 的 负担 过 重 ， 容 易 出 现 瓶 颈 。 另 外 ， 系 统 对 这 个 节点 的 依赖 性 也 过 多 ， 一 旦 这 个 节点 出 现 故 
障 ， 将 使 整个 系统 月 省 ， 系 统 的 可 靠 性 就 相对 较 差 ， 为 了 提高 系统 的 可 靠 性 ， 该 节点 的 设备 就 
必须 提高 。 

(2) 分 割 式 : 所 有 全 局 数据 有 且 只 有 一 份 ， 它 们 被 分 割 成 若干 个 逻辑 片段 ， 每 个 逻辑 片段 
被 分 别 指派 在 特定 的 节点 上 ， 可 以 说 对 全 局 数据 进行 了 划分 。 

这 种 分 布 策 略 充分 利用 各 个 站 点 上 的 存储 设备 ， 数 据 的 存储 量 大 。 在 存放 数据 的 各 个 节点 
可 自治 地 检索 和 修改 数据 ,发 挥 系统 的 并 发 操作 能 力 。 同 时 ， 由 于 数据 是 分 布 在 多 个 节点 上 的 
所 以 当 某 部 分 节点 出 现 故障 时 ， 系 统 仍 可 运行 ， 提 高 了 系统 的 可 靠 性 。 对 于 全 局 查询 和 修改 ， 
所 需 的 时 间 会 比 集中 式 长 些 ， 因 为 数据 不 在 同一 场地 上 ， 需 要 进行 网 络 通信 。 

(3) 复制 式 : 全 局 数据 有 多 个 副本 ， 每 个 站 点 上 都 有 一 个 完整 的 数据 副本 。 

采用 这 种 策略 的 系统 可 靠 性 较 高 ， 响 应 速度 快 。 数 据 库 的 恢复 也 较 容 易 ， 可 从 任意 的 场地 
得 到 数据 的 副本 。 但 是 要 保持 各 个 站 点 上 数据 的 同步 修改 ， 将 要 付出 昂贵 的 代价 。 另 外 ， 整 个 
系统 的 数据 见 余 很 大 ， 系 统 的 数据 容量 也 只 是 一 个 节点 上 数据 库 的 容量 。 

(4) 混合 式 : 全 部 数据 被 分 为 若干 个 数据 子 集 ， 每 个 子 集 被 放 在 不 同 的 节点 上 ， 但 任何 一 
个 节点 都 没有 保存 全 部 的 数据 ， 根 据 数据 的 重要 性 决定 各 个 数据 子 集 副本 的 数量 。 

这 种 分 布 策略 ， 兼 顾 了 分 割 式 和 复制 式 的 做 法 ， 也 获得 了 二 者 的 优点 ， 它 灵活 性 好 ， 能 提 
高 系统 的 效率 ， 但 同时 也 包括 了 二 者 的 复杂 性 。 


3， 数据 分 片 


数据 分 片 也 称 数据 分 割 ， 是 分 布 式 数据 库 的 特征 之 一 。 在 一 个 分 布 式 数据 库 中 ， 全 局 数据 
库 是 由 各 个 局 部 数据 库 逻 辑 组 合 而 成 。 相 反 ， 各 个 局 部 数据 库 则 是 全 局 数据 库 的 某 种 逻辑 分 割 
而 得 。 实 际 上 这 也 是 应 用 的 需要 ， 以 关系 型 模型 为 例 来 说 明 ， 一 个 关系 描述 了 某 些 数据 之 间 的 
逻辑 相关 性 ， 但 是 ， 因 为 不 同 节点 的 用 户 对 该 关系 中 元 组 的 需求 可 能 是 不 同 的 。 例 如 ， 某 个 关 
系 中 的 元 组 是 与 地 区 有 关 ， 西 安 的 用 户 需 要 的 是 有 关 “ 西 安 ” 的 那些 元 组 ， 而 广州 的 用 户 需要 
的 是 有 关 “ 广 州 ” 的 那些 元 组 。 这 就 需要 对 这 个 关系 进行 分 割 ， 分 割 后 得 到 的 各 部 分 元 组 称 为 
该 关系 的 逻辑 片段 ， 并 被 存放 在 相应 的 节点 上 。 这 样 处 理 将 各 得 其 所 ， 可 以 大 大 减少 网 络 上 的 
通信 ， 从 而 提高 系统 的 响应 效率 。 
在 分 布 式 数据 库 中 ， 数 据 存放 的 单位 是 数据 的 逻辑 片段 。 对 关系 型 数据 库 来 说 ， 一 个 数据 
的 逻辑 片段 是 关系 的 一 部 分 。 数 据 分 片 有 三 种 基本 方法 ， 它 们 是 通过 关系 代数 的 基本 运算 来 实 
现 的 。 

(1) 水 平分 片 ， 按 特定 条 件 把 全 局 关系 的 所 有 元 组 ， 分 划 成 若干 个 互 不 相交 的 子 集 ， 每 一 
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子 集 为 全 局 关系 的 一 个 逻辑 片段 。 它 们 通过 对 全 局 关系 施加 选择 运算 得 到 ， 并 可 通过 对 这 些 片 
段 执 行 合并 操作 来 恢复 该 全 局 关系 。 

(2) 垂直 分 片 : 把 全 局 关系 的 属性 分 成 若干 子 集 ， 对 全 局 关系 作 投影 运算 得 到 这 些 子 集 。 
要 求全 局 关系 的 每 一 属性 至 少 映 射 到 一 个 垂直 片段 中 ， 且 每 一 个 垂直 片段 都 包含 该 全 局 关系 的 
关键 字 。 这 样 ， 通 过 对 这 些 片段 执行 连接 操作 可 以 恢复 该 全 局 关系 。 

(3) 水 平和 垂直 结合 的 分 片 :以 上 两 种 方法 的 混合 。 可 以 先 水 平分 片 再 垂直 分 片 ， 或 先 垂 
直 分 片 再 水 平分 片 。 

不 论 采用 哪 一 种 方法 进行 数据 分 片 ， 都 要 遵守 如 下 规则 。 

(1) 完备 性 条 件 : 必须 把 全 局 关系 的 所 有 数据 映射 到 各 个 片段 中 ， 绝 不 允许 有 属于 全 局 关 
系 却 不 属于 任何 一 个 片段 的 数据 存在 。 

(2) 可 重 构 条 件 ， 必须 保证 能 够 由 同一 个 全 局 关系 的 各 个 片段 来 重新 构造 该 全 局 关系 。 对 
于 水 平分 片 可 用 并 操作 重 构 全 局 关系 ， 对 于 垂直 分 片 可 用 连接 操作 重 构 全 局 关系 。 

(3) 不 相交 条 件 : 要 求 一 个 全 局 关系 被 分 割 后 所 得 的 各 数据 片段 互 不 重 且 或 只 包含 关键 字 
E 登 。 


4. 分布 透 明 性 


在 分 布 式 数据 库 中 ， 数 据 独 立 性 是 十 分 重要 的 ， 其 内 容 比 集中 式 数据 库 更 加 复杂 。 除 了 数 
据 的 逻辑 独立 性 与 数据 的 物理 独立 性 外 ， 还 有 数据 的 分 布 独立 性 。 所 谓 数据 分 布 独立 性 是 指 用 
户 或 用 户 程序 使 用 分 布 式 数据 库 如 同 使 用 集中 式 数据 库 那 样 ， 不 必 关 心 全 局 数据 的 分 布 情况 ， 
即 用 户 不 必 关心 全 局 数据 的 逻辑 分 片 情况 、 逻 辑 片 段 的 场地 位 置 分 配 情况 以 及 各 场地 上 数据 库 
的 数据 模型 等 。 也 就 是 说 ， 全 局 数据 的 逻辑 分 片 、 片 段 的 物理 位 置 分 配 、 各 场地 数据 库 的 数据 
模型 等 情况 对 用 户 和 应 用 程序 是 透明 的 。 所 以 ， 在 分 布 式 数据 库 中 分 布 独立 性 也 称 为 分 布 透明 
性 。 下 面 我 们 来 看 看 分 布 透 明 性 的 各 种 级 别 。 

1) 分 片 透明 性 

分 片 透明 性 是 分 布 透明 性 中 的 最 高 层 ， 在 四 层 分 布 式 数据 库 模式 结构 中 ， 分 片 透明 性 位 于 
全 局 概念 模式 与 分 片 模式 之 间 。 当 分 布 式 数据 库 具有 分 片 透明 性 时 ， 用 户 编写 的 应 用 程序 只 对 
全 局 关系 进行 操作 ， 而 不 必 考 虑 数据 的 逻辑 分 片 ， 当 分 片 模式 改变 时 ， 只 要 改变 全 局 概念 模式 
到 分 片 模式 之 间 的 映像 ， 从 而 不 会 影响 应 用 程序 ， 实 现 了 数据 分 片 透明 性 。 

2) 分 配 透明 性 

分 配 透明 性 是 分 布 透明 性 的 中 间 层 ， 在 四 层 的 分 布 式 数据 库 模式 结构 中 ， 位 于 分 片 模式 与 
分 配 模式 之 间 。 实 际 上 ， 分 配 透明 性 包含 了 两 种 情形 : 一 种 是 各 片段 被 复制 的 情况 ， 即 每 一 片 
段 是 否 被 复制 、 复 制 了 几 个 副本 ; 另 一 种 是 片段 及 其 各 副本 的 场地 的 位 置 分 配 情况 。 前 者 也 称 
复制 透明 性 或 数据 见 余 透 明 性 。 当 分 布 式 数据 库 具有 分 配 透明 性 时 ， 用 户 编写 的 应 用 程序 要 了 
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解 全 局 数据 的 数据 分 片 情况 ， 但 不 必 了 解 各 逻辑 片段 的 复制 副本 情况 ， 也 不 必 关 心 各 片段 及 其 
副本 的 站 点 位 置 分 配 情况 。 当 片段 及 其 副本 的 存储 站 点 改变 时 ， 只 要 改变 从 分 片 模式 到 分 配 模 
式 之 间 的 映像 ， 从 而 不 会 影响 用 户 程序 ， 实 现 了 数据 片段 的 位 置 透明 性 。 

3) 局 部 数据 模型 透明 性 

局 部 数据 模型 透明 性 也 称 局 部 映像 透明 性 ， 即 与 各 场地 上 数据 库 的 数据 模型 无 关 ， 是 分 布 
透明 性 的 最 低层 ， 在 四 层 分 布 式 数据 库 模式 结构 图 中 ， 处 于 分 配 模式 与 局 部 概念 模式 之 间 。 当 
分 布 式 数据 库 只 具有 局 部 数据 模型 透明 性 时 ， 用 户 编写 应 用 程序 不 但 要 了 解 全 局 数据 的 逻辑 分 
片 情况 ， 还 要 了 解 各 逻辑 片段 的 副本 复制 情况 ， 以 及 各 片段 和 它们 副本 的 站 点 位 置 分 配 情况 ， 
但 不 必 了 解 各 站 点 上 数据 库 的 数据 模型 。 全 局 数据 模型 与 每 个 节点 上 的 局 部 数据 库 的 数据 模型 
的 转换 是 由 分 配 模式 与 局 部 概念 模式 之 间 的 映像 实现 的 。 当 某 个 节点 上 数据 库 的 数据 模型 改变 
时 ， 只 要 改变 分 配 模式 到 该 站 点 局 部 概念 模式 之 间 的 映像 即 可 ， 应 用 程序 不 受 影响 ， 从 而 实现 
了 局 部 数据 模型 透明 性 。 显 然 ， 在 同 构 分 布 式 数据 库 系统 中 ， 其 各 站 点 上 的 数据 模型 相同 ， 且 
有 可 能 全 局 数据 库 的 数据 模型 就 采用 局 部 数据 库 的 数据 模型 ， 此 时 ， 就 大 大 减少 了 这 种 映像 的 
复杂 性 。 

如 果 一 个 分 布 式 数据 库 系 统 提供 了 分 片 透明 性 ， 它 一 定 也 提供 了 分 配 透 明 性 和 局 部 数据 模 
型 透明 性 ， 所 以 也 称 为 完全 分 布 透 明 性 ， 是 分 布 透明 性 的 最 高 级 别 。 此 时 ， 对 用 户 和 用 户 程序 
而 言 ， 他 们 所 面 对 的 分 布 式 数据 库 系 统 ， 如 同 集中 式 数 据 库 一 样 ， 不 必 考 虑 数据 的 分 片 细节 、 
不 必 考 虑 各 片段 的 副本 情况 、 不 必 考 虑 片段 及 副本 的 分 配 细节 ， 也 无 须 考虑 各 站 点 上 数据 库 是 
什么 数据 模型 等 。 

如 果 一 个 分 布 式 数据 库 系统 提供 分 配 透 明 性 ， 而 没有 提供 分 片 透明 性 ， 它 一 定 也 提供 局 部 
数据 模型 透明 性 ， 所 以 也 称 为 中 级 分 布 透 明 性 ， 此 时 ， 对 用 户 和 应 用 程序 而 言 ， 他 们 必须 知道 
分 布 式 数据 库 全 局 数据 的 逻辑 分 片 情况 ， 在 程序 中 必须 指出 所 需要 访问 的 逻辑 片段 名 。 但 不 必 
关心 逻辑 片段 是 否 被 复制 以 及 它们 被 分 配 在 哪些 站 点 上 ， 也 不 必 考 虑 站 点 的 数据 模型 。 

如 果 一 个 分 布 式 数据 库 系统 只 提供 局 部 数据 模型 透明 性 而 不 提供 分 片 透明 性 ， 也 不 提供 分 
配 透 明 性 ， 则 被 称 为 低级 分 布 透明 性 。 此 时 ， 对 用 户 和 应 用 程序 而 言 ， 他 们 不 但 必须 知道 分 布 
式 数据 库 全 局 数据 的 逻辑 分 片 情况 ， 还 必须 知道 各 片段 是 否 有 副本 、 有 多 少 副 本 、 各 片段 及 其 
副本 被 分 配 在 哪些 站 点 上 。 即 在 程序 中 不 仅 要 指定 要 访问 的 数据 逻辑 片段 名 ， 还 要 指定 它们 所 
在 的 节点 名 ， 但 不 必 考虑 站 点 上 的 数据 模型 。 

如 果 一 个 分 布 式 数据 库 系 统 ， 连 局 部 数据 模型 透明 性 也 不 提供 ， 即 将 异 构 数 据 模型 转换 也 
交 给 用 户 和 用 户 程序 自己 处 理 ， 这 种 分 布 式 数据 库 系 统称 为 无 分 布 透明 性 。 

此 可 见 ， 一 个 分 布 式 数据 库 系 统 可 能 提供 的 分 布 透 明 性 的 层次 越 高 ， 用 户 编写 应 用 程序 
越 容 易 。 因 此 ， 一 个 分 布 式 数据 库 系 统 可 能 提供 的 分 布 透明 性 的 程度 ， 也 是 衡量 分 布 式 数据 库 
管理 系统 是 否 完善 的 标准 之 一 。 
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有 


6 式 数据 库 的 建立 和 维护 ， 皮 博 尔 (Peebll) 和 曼 宁 (Manning) 两 位 博士 把 分 布 式 数据 库 管理 
系统 分 成 两 大 类 : 综合 型 和 联合 型 。 


理 系 统 ， 设 计 人 员 根 据 用 户 的 需求 ， 设 计 出 一 个 全 新 的 完整 的 数据 库 管 理 系统 。 


S.， 分 布 式 数据 库 管理 系统 


分 布 式 数据 库 管 理 系统 (Distributed Database Management System，DDBMS) 用 以 支持 分 


(1) 综合 型 体系 结构 : 是 指 在 分 布 式 数据 库 建立 之 前 ， 还 没有 建立 独立 的 集中 式 数据 库 管 


(2) 联合 型 体系 结构 : 是 指 每 个 节点 的 数据 库 管理 系统 已 经 存在 ， 在 此 基础 上 建立 的 分 布 


式 数据 库 系统 。 同 时 ， 联 合 型 体系 结构 又 分 为 同 构 系统 和 异 构 系 统 。 所 谓 同 构 系 统 是 指 每 个 节 
点 的 局 部 数据 库 管理 系统 支持 同一 种 数据 模式 、 命 令 语言 及 查询 语言 ， 而 异 构 系 统 是 指 各 个 节 
点 上 的 数据 库 管理 系统 有 不 同 的 数据 模式 、 命 令 语言 及 查询 语言 。 


1987 年 , 关系 数据 库 的 最 早 设计 者 C.J.Date 提出 了 完全 的 分 布 式 数据 库 管理 系统 应 遵循 的 


12 条 规则 。 这 12 条 规则 已 被 广泛 接受 ， 并 作为 分 布 式 数据 库 系 统 的 标准 定义 。 它 们 是 : 


系统 为 完全 的 分 布 式 管理 系统 。 图 12-4 给 出 了 一 个 分 布 式 数据 库 管理 系统 的 参考 结构 。 


(1) 本 地 自治 性 

(2) 不 依赖 于 中 心 站 点 
(3) 可 连续 操作 性 

(4) 位 置 透明 性 和 独立 性 
(5) 数据 分 片 独 立 性 

(6) 数据 复制 独立 性 

(7) 分 布 式 查询 处 理 

(8) 分 布 式 事务 管理 
(9) 硬件 独立 性 
(10) 操作 系统 独立 性 

(11) 网 络 独立 性 

(12) DBMS 独立 性 

如 果 一 个 分 布 式 数 据 库 管 理 系统 能 够 满足 上 面 的 12 条 准则 ， 我 们 就 可 称 这 个 分 布 式 管理 


分 布 式 数据 库 管 理 系统 由 以 下 四 部 分 组 成 。 
(1) LDBMS， 局 部 场地 上 的 数据 库 管理 系统 ， 其 功能 是 建立 和 管理 局 部 数据 库 ， 提 供 场地 


自治 能 力 ， 执 行 局 部 应 用 及 全 局 查询 的 子 查询 。 


(2) GDBMS， 全 局 数据 库 管理 系统 ， 主 要 功能 是 提供 分 布 透明 性 ， 协 调 全 局 事务 的 执行 ， 


协调 各 局 部 数据 库 管 理 系统 以 完成 全 局 应 用 ， 保 证 数据 库 的 全 局 一 致 性 ， 执 行 并 发 控制 ， 实 现 
更 新 同步 ， 提 供 全 局 恢复 功能 等 。 
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(3) 全 局 数据 字典 (Global Data Directory，GDD)， 提 供 模式 、 分 片 模式 、 分 配 模式 的 定 
义 以 及 模式 之 间 映 像 的 定义 、 存 取 权 限 的 定义 ， 以 保证 全 用 户 的 合法 权限 和 数据 库 的 安全 性 ， 
关于 约束 条 件 的 定义 ， 其 功能 与 集中 式 数据 库 的 数据 字典 类 似 。 

(4) 通信 管理 (Communication Management，CM)， 通 信 管理 系统 在 分 布 数据 库 各 场地 之 
间 传 送 消息 和 数据 ， 完 成 通信 功能 。 


局 部 数据 库 局 部 数据 库 


图 12-4 分 布 式 数据 库 管理 系统 结构 图 


12.1.3 ”分 布 式 查询 处 理 和 优化 


在 集中 式 关系 型 数据 库 中 ， 数 据 的 存 取 过 程 和 数据 的 存储 结构 对 用 户 和 应 用 都 是 透明 的 ， 
用 户 依 据 数据 模型 表达 查询 要 求 。 借助 于 SQL 一 些 语言 来 存 取 数 据 。 这 些 数据 存 取 及 优化 过 程 
数据 库 管理 系统 中 的 数据 操作 处 理 模块 去 完成 ， 它 们 决定 了 系统 的 效率 。 分 布 式 数据 库 中 查 
询 处 理 问 题 的 基础 是 集中 式 关 系数 据 库 系 统 中 的 概念 及 策略 。 分 布 式 查询 处 理 从 讨论 分 布 式 查 
询 的 特点 入 手 ， 并 假设 分 布 式 数据 库 管 理 系统 提供 完全 透明 性 。 

分 布 式 数据 库 环境 中 的 查询 与 集中 式 数据 库 环 境 中 的 查询 相 比较 ， 要 增加 对 以 下 两 个 方面 
的 考虑 。 

(1) 数据 和 信息 均 要 通过 通信 线路 进行 传输 , 存在 延迟 的 问题 将 减 慢 整个 查询 的 执行 过 程 。 

(2) 网 络 中 多 处 理 器 的 存在 提供 了 并 行 数据 处 理 和 传输 的 机 会 ， 应 充分 利用 以 加 快 查询 的 
速度 。 
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在 分 布 式 数据 库 系统 中 ， 查 询 优化 器 的 主要 任务 是 控制 和 加 快 查询 执行 与 数据 传输 过 程 。 
在 分 布 式 查询 处 理 技术 中 ， 查 询 优化 的 基本 类 型 通常 包括 两 类 : 针对 查询 执行 代价 的 优化 和 针 
对 查询 响应 时 间 的 优化 。 执 行 代价 是 指 查 询 所 需要 的 系统 资源 ， 查 询 响应 时 间 是 指 查询 开始 提 
交 到 获得 第 一 个 结果 之 间 的 时 间 。 一 般 情况 下 ， 查 询 响应 时 间 对 一 个 组 织 机 构 而 言 ， 往 往 就 代 
表 着 执行 代价 。 例如 对 于 一 个 商业 组 织 机 构 , 因为 响应 时 间 的 延误 而 失掉 了 销售 额 或 其 他 机 会 ， 
就 意味 着 商业 损失 ， 但 是 ， 出 于 教学 和 编程 方面 的 某 些 原因 ， 我 们 需要 将 查询 执行 代价 和 响应 
时 间 加 以 区 分 。 

针对 查询 执行 代价 进行 优化 的 目标 是 ， 使 查询 执行 所 使 用 的 系统 资源 的 总 和 尽量 地 少 ， 从 
而 降低 系统 开销 ， 整 个 系统 的 开销 可 以 从 各 单个 系统 资源 的 开销 表达 式 中 推出 。 针 对 查询 响应 
时 间 优 化 的 目标 是 尽量 减少 查询 的 响应 时 间 ， 而 不 计较 系统 资源 的 耗费 。 可 以 形象 地 说 ， 执 行 
代价 优化 的 目标 是 “最 便宜 ”， 而 响应 时 间 优 化 的 目标 是 “最 快 ”。 


12.1.4 “分 布 事务 管理 


1， 分 布 式 事务 


一 个 事务 是 访问 数据 库 的 一 个 逻辑 工作 单位 ， 它 是 一 个 操作 序列 ， 执 行 这 个 操作 序列 ， 使 
数据 库 从 一 种 一 致 状态 转换 到 男 一 种 一 致 状态 ， 以 实现 特定 的 业务 功能 。 

分 布 式 事务 是 传统 事务 的 扩充 ， 在 分 布 式 数据 库 系统 中 ， 任 何 一 个 应 用 的 请 求 最 终 都 将 转 
化 成 对 数据 库存 取 操 作 的 序列 ， 所 以 分 布 式 事务 从 外 部 特征 来 看 ， 继 承 了 传统 事务 的 定义 。 但 
是 ,由 于 在 分 布 式 数据 库 系 统 中 , 数据 是 分 布 的 , 一 个 事务 的 执行 可 能 涉及 多 个 站 点 上 的 数据 ， 
这 使 得 分 布 式 事务 的 执行 方式 与 传统 事务 的 执行 方式 不 同 ， 传 统 集中 式 事务 只 在 一 台 计算 机 上 
执行 ， 而 分 布 式 事务 将 在 多 个 站 点 上 的 多 台 计算 机 上 执行 ， 即 分 布 式 事务 的 执行 也 是 分 
布 的 。 
在 分 布 式 数据 库 系 统 中 ， 用 分 布 式 事务 表明 一 个 要 求 访问 多 个 站 点 上 数据 库 中 数据 的 事 
务 ， 但 不 关心 存放 数据 的 具体 地 点 。 分 布 式 数据 库 管理 系统 的 事务 优化 器 实现 把 一 个 分 布 式 导 
务 转 变 为 若干 个 与 相应 站 点 有 关 的 操作 序列 组 成 ， 这 些 操作 序列 也 称 为 “ 子 事务 "。 所 以 ， 在 
分 布 式 数据 库 系 统 中 ， 可 以 把 一 个 分 布 式 事务 看 成 是 由 若干 个 不 同 站 点 上 的 子 事务 组 成 。 


2. 分 布 式 事务 的 特性 


分 布 式 事务 和 集中 式 数据 库 中 的 事务 一 样 具有 下 面 的 特性 。 

(1) 原子 性 : 事务 的 操作 要 么 全 部 执行 ， 要 么 全 部 不 执行 。 当 事务 非 正常 终止 时 ， 其 中 间 
结果 将 被 取消 。 事 务 的 原子 性 保证 数据 库 的 状态 总 是 从 一 个 一 致 的 状态 变化 到 另 一 个 一 致 的 状 
态 ， 而 不 会 出 现 不 一 致 的 中 间 状 态 。 
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(2) 可 串 行 性 或 一 致 性 : 并 发 执行 的 几 个 事务 ， 其 操作 的 结果 应 与 以 某 种 顺序 串 行 执行 这 
儿 个 事务 所 得 出 的 结果 相同 ， 因 此 称 为 可 串 行 性 。 这 种 可 串 行 化 的 并 行 调度 是 由 数据 库 系 统 的 
并 发 控制 机 制 来 完成 ， 以 保证 并 发 事务 执行 时 的 数据 库 状 态 的 一 致 。 所 以 这 种 性 质 也 称 为 事务 
的 一 致 性 。 

(3) 隔离 性 : 一 个 没 执行 完 的 事务 不 能 在 其 提交 之 前 把 自己 的 中 间 结 果 提 供给 其 他 的 事务 
使 用 。 因 为 未 提交 事务 的 结果 不 是 最 终结 果 ， 它 有 可 能 在 以 后 的 执行 中 被 迫 取消 ， 如 果 其 他 的 
事务 用 到 了 它 的 中 间 结 果 ， 那 么 该 事务 也 要 天 折 。 

(4) 持久 性 ， 当 一 个 事务 正常 结束 后 ， 即 提交 后 ， 其 操作 的 结果 将 永久 化 ， 提 交 后 发 生 的 
故障 不 会 影响 提交 结果 。 即 使 发 生 了 故障 ， 系 统 应 能 够 保证 可 以 把 事务 的 操作 结果 恢复 过 来 。 

人 们 常 把 事务 的 原子 性 (Atomicity)、 可 串 行 性 〈Serializability) 或 一 致 性 〈Consistency)、 
隔离 性 〈Isolation) 和 持久 性 (Durability)， 称 为 事务 的 四 个 特性 ， 简 写 为 ASID 或 ACID。 
于 分 布 式 数 据 库 系统 的 分 布 特性 ， 分 布 式 事务 的 四 性 更 带 有 分 布 执行 时 的 特性 。 例 如 ， 
在 分 布 式 数据 库 系统 中 ， 为 了 保证 事务 的 原子 性 ， 组 成 这 个 分 布 式 事务 的 各 个 子 事务 ， 要 么 全 
部 都 提交 (成功 结束 )， 要 么 全 都 撤销 〈 不 成 功 结束 )， 这 就 需要 对 各 子 事务 进行 协调 和 控制 。 
此 外 ， 在 分 布 式 事务 中 ， 除 了 需要 考虑 访问 数据 互 斥 的 存 取 操作 序列 外 ， 还 必须 考虑 大 量 的 数 
据 传送 、 通 信 原 语 和 控制 报 文 等 ， 这 些 都 是 分 布 式 事务 所 特有 的 性 质 。 因 此 分 布 式 事务 与 集中 
式 数 据 库 中 的 事务 相 比 ， 在 下 面 几 个 特性 有 所 区 别 。 

(1) 执行 特性 : 由 于 分 布 式 事务 执行 时 被 分 解 成 多 个 子 事务 执行 ， 而 各 子 事务 间 的 操作 需 
要 进行 协调 ， 因 此 每 一 个 分 布 式 事务 必须 创建 一 个 控制 进程 〈 亦 称 协调 进程 )， 以 协调 各 子 事 
务 的 操作 ， 协 调 数据 及 控制 报 文 的 收发 ， 决 定 事 务 的 提交 与 天 折 。 而 集中 式 事务 的 执行 由 并 行 
调度 算法 调度 ， 不 必 产 生 一 个 控制 进程 ， 也 不 必 分 解 为 子 事务 。 

(2) 操作 特性 ， 在 分 布 式 事务 中 ， 除 了 应 用 对 数据 的 存 取 操作 序列 之 外 ， 还 必须 加 入 大 量 
的 通信 原 语 ， 负 责 协 调 进程 和 代理 进程 (负责 完成 子 事 务 ) 之 间 的 数据 传送 ， 以 及 代理 进程 之 
间 的 数据 传送 。 此 外 ， 为 了 协调 子 事务 的 执行 ， 还 要 加 入 大 量 的 控制 原 语 。 因 此 ， 分 布 式 事务 
比 集中 式 事务 的 组 成 要 复杂 ， 而 且 执 行 的 方式 也 要 复杂 得 多 。 

(3) 控制 报 文 : 分 布 式 数据 库 系统 中 ， 除 了 数据 报 文 外 ， 更 增加 了 控制 报 文 。 因 为 除了 要 
对 数据 进行 存 取 操 作 外 ， 还 要 对 各 子 事务 的 操作 进行 协调 ， 这 样 就 有 了 大 量 的 控制 报 文 要 在 网 
上 传输 。 


3。. 分布 式 数据 库 故障 
在 集中 式 数据 库 系 统 中 ， 故 障 分 为 事务 故障 、 系 统 故障 和 介质 故障 。 
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在 分 布 式 数据 库 系统 中 ， 除 了 上 述 故 障 外 还 有 因 网 络 引起 的 故障 。 一 般 ， 把 网 络 上 各 站 点 
可 能 出 现 的 故障 称 为 站 点 故障 ， 它 们 包括 集中 式 系统 中 可 能 发 生 的 故障 ， 而 把 站 点 之 间 通 信 : 
现 的 故障 称 为 通信 故障 。 
通信 故障 可 分 为 报 文 故 障 和 网 络 分 割 故障 。 而 报 文 故障 又 可 分 为 报 文 错 、 报 文 失 序 、 报 文 
丢失 和 长 时 间 地 延迟 。 对 报 文 错 和 报 文 失 序 现今 网 络 都 可 检测 和 处 理 ， 所 以 通信 故障 主要 是 报 
文 丢失 、 报 文 延 迟 和 网 络 分 割 。 下 面 我 们 对 每 一 种 故障 做 解释 。 

(1) 介质 故障 : 存放 数据 的 介质 发 生 的 故障 ， 如 磁带 ， 磁 盘 的 损坏 等 。 

(2) 系统 故障 : CPU 错 、 死 循环 、 缓 冲 区 满 、 系 统 衣 溃 等 。 

(3) 事务 故障 : 计算 溢出 、 完 整 性 被 破坏 、 操 作 员 干 预 、 输 入 输出 错 等 。 

(4) 网 络 分 割 故 障 : 系统 中 一 部 分 的 节点 和 另外 一 部 分 节点 完全 失去 了 联系 ， 两 组 节点 无 


法 通信 。 
(5) 报 文 故障 : 收 到 的 报 文 格式 或 数据 错误 、 报 文 先后 次 序 不 正确 、 丢 失 了 部 分 报 文 和 长 
时 间 收 不 到 报 文 。 
综 上 所 述 ， 故 障 的 分 类 如 图 12-5 所 示 。 
介质 故障 
节点 故障 系统 故障 
事务 故障 
故障 
网 络 分 割 故障 
通信 故障 报 文 错 
报 文 故障 1 报 文 从 序 
报 文 丢失 
长 时 间 延 迟 


图 12-5 故障 的 分 类 图 


当 在 规定 时 间 内 未 接 到 应 答 时 ， 就 要 进行 如 下 的 分 析 。 

(1) 是 系统 发 生 故障 ， 还 是 性 能 不 好 ， 还 是 网 络 流量 过 大 ? 

(2) 如 果 是 系统 发 生 故 障 ， 是 站 点 故障 ， 还 是 报 文 故 障 ， 还 是 网 络 分 割 ? 

(3) 如 果 是 报 文 故障 ， 是 报 文 丢失 还 是 应 答 丢 失 ? 等 等 。 

处 理 网 络 分 割 故 障 要 比 处 理 站 点 故障 和 报 文 故障 因 难 得 多 ， 但 其 发 生 频 率 也 低 于 站 点 故障 
和 报 文 故障 。 按 照 故 障 处 理 难度 的 升序 排列 ， 则 为 : 

(1) 仅 发 生 站 点 故障 。 
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(2) 站 点 故障 与 报 文 故障 同时 存在 。 
(3) 站 点 故障 、 报 文 故障 和 网 络 分 割 故障 同时 存在 。 


4. 分 布 式 数据 库 的 恢复 原则 


故障 的 发 生 会 影响 数据 库 中 数据 的 正确 性 ， 甚 至 破坏 数据 库 ， 从 而 影响 数据 库 系统 的 可 靠 
性 和 可 用 性 。 因 此 ， 数 据 库 管理 系统 都 对 故障 恢复 机 制 很 下 功夫 ， 认 真 地 做 了 研究 和 开发 。 研 
究 数据 库 系统 中 故障 的 恢复 ， 主 要 是 指 如何 恢 复 因 故 障 而 破坏 的 数据 库 ， 使 数据 库 恢 复 到 正 硼 
状态 。 由 前 面 分 析 可 知 ， 在 分 布 式 数据 库 系 统 中 ， 故 障 的 类 型 很 多 。 当 发 生 事务 故障 时 ， 保 证 
事务 原子 性 的 措施 称 为 事务 故障 恢复 ， 简 称 为 事务 恢复 。 事 务 本 身 的 故障 和 系统 的 故障 是 造成 
数据 库 完整 性 和 一 致 性 破坏 的 主要 原因 。 当 发 生 事务 故障 时 ， 保 证 事务 原子 性 的 措施 称 为 事务 
故障 恢复 ， 简 称 为 事务 恢复 。 事 务 恢复 主要 是 依靠 日 志 来 实现 的 。 恢 复 应 遵循 的 原则 如 下 。 

(1) 孤立 和 逐步 退出 事务 的 原则 

对 于 不 影响 其 他 事务 的 可 排除 性 局 部 故障 , 例如 事务 操作 的 删除 、 超 时 、 违 反 完整 性 规则 、 
资源 、 限 制 、 死 锁 等 , 应 令 某 个 事务 孤立 地 和 逐步 地 退出 , 将 其 所 做 过 的 修改 复原 , 即 做 UNDO。 

(2) 成 功 结束 事务 原则 

成 功 结束 事务 所 做 过 的 修改 应 超越 各 种 故障 ， 当 故障 发 生 时 ， 应 该 重 做 (REDO) 事务 的 
所 有 操作 。 

(3) 天 折 事 务 的 原则 

若 发 生 了 非 局 部 性 的 不 可 排除 的 故障 ， 例 如 系统 崩溃 ， 则 撤销 全 部 事务 ， 恢 复 到 初 态 ， 这 
有 两 种 做 法 ， 一 种 是 利用 数据 库 的 备份 实现 ， 另 一 种 是 按 反 向 顺序 操作 ,复原 其 启动 以 来 所 做 
过 的 一 切 修改 。 

从 集中 式 事务 恢复 可 以 了 解 事务 恢复 的 一 般 过 程 , 对 分 布 式 事务 来 说 , 由 于 处 于 网 络 环境 ， 
其 恢复 处 理 远 比 集中 式 事务 恢复 要 复杂 得 多 。 在 分 布 式 事务 恢复 中 ， 本 地 事务 的 恢复 和 集中 式 
事务 的 恢复 相同 ， 由 本 地 事务 管理 器 (Local Transact Management，LTM) 具体 执行 ;而 整个 分 
布 式 事务 的 恢复 由 分 布 式 事务 管理 器 (Distribute Transact Management，DTM) 与 LTM 协同 
完成 。 


5. 两 阶段 提交 协议 


两 阶段 提交 协议 (Two Phase Commitment Protocol，2PC) 既 简单 又 精巧 ， 它 把 本 地 原子 性 
提交 行为 的 效果 扩展 到 分 布 式 事务 ， 保 证 了 分 布 式 事务 提交 的 原子 性 ， 并 在 不 损坏 日 志 的 情况 
下 ， 实 现 快 速 故障 恢复 ， 提 高 分 布 式 数据 库 系 统 的 可 靠 性 。 
在 两 阶段 提交 协议 中 ， 把 分 布 式 事务 的 某 一 个 代理 指定 为 协调 者 (Coordinator)， 所 有 其 他 
代理 称 为 参与 者 Participant)。 这 里 的 代理 是 指 完成 各 个 子 事务 的 进程 。 只 有 协调 者 才 拥 有 提 
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交 或 撤销 事务 的 决定 权 ， 而 其 他 参与 者 各 自负 责 在 其 本 地 数据 库 中 执行 写 操作 ， 并 向 协调 者 提 
出 撤销 或 提交 事务 的 意向 。 一 般 一 个 站 点 唯一 地 对 应 一 个 子 事务 ， 如 果 某 一 参与 者 与 协调 者 在 
同一 站 点 , 虽然 它们 不 需要 使 用 网 络 来 通信 , 但 仍 罗 辑 地 认为 它 与 协调 者 不 在 同一 站 点 。 图 12-6 
描述 了 协调 者 和 参与 者 的 关系 。 

2PC 保证 分 布 式 事务 提交 的 原子 性 ， 这 是 通过 在 分 布 式 事务 的 结果 生效 以 前 ， 所 有 参与 执 
行 分 布 式 事务 的 站 点 都 同意 提交 而 做 到 这 一 点 的 。 这 种 同步 的 必要 性 有 很 多 理由 ， 如 果 某 个 
务 正在 读 一 项 由 另 一 个 还 未 提交 的 事务 更 新 的 数据 项 的 值 时 ， 相 应 的 参与 者 就 不 会 同意 马上 提 
交 该 事务 。 另 一 种 参与 者 不 同意 提交 的 可 能 的 原因 是 发 生 了 死 锁 ， 这 要 求 菜 一 个 参与 者 撤销 于 
务 。 注 意 ， 参 与 者 不 需要 任何 其 他 进程 来 通知 就 可 以 撤销 一 个 事务 ， 这 种 能 力 相 当 重 要 ， 我 们 
称 之 为 单方 面 撤销 。 


| | | 


[coordinator {Participant | | Participant | | Participant | 


| 辣 | 部 | 


图 12-6 协调 者 和 参与 者 的 关系 图 


2PC 把 事务 的 提交 过 程 分 为 两 个 阶段 : 第 一 阶段 是 表决 阶段 , 目的 是 形成 一 个 共同 的 决定 。 
开始 时 ， 协 调 者 在 它 的 日 志 中 写 入 一 条 开始 提交 的 记录 ， 再 给 所 有 参与 者 发 送 “ 准 备 提交 ” 消 
息 ， 并 进入 等 待 状态 。 当 参与 者 收 到 “准备 提交 ”消息 后 ， 它 检查 是 否 能 提交 本 地 事务 。 如 果 
能 提交 ， 参 与 者 在 日 志 中 写 入 一 条 就 绪 记 录 ， 并 给 协调 者 发 送 “建议 提交 ”消息 ， 然 后 进入 就 
绪 状 态 : 和 否则， 参与 者 写 入 撤销 记录 ， 并 给 协调 者 发 送 “ 建 议 撤销 ”消息 。 如 果 某 个 站 点 做 出 
“建议 撤销 ”提议 ， 由 于 撤销 决定 具有 否决 权 〈 即 单方 面 撤销 )， 发 出 “建议 撤销 ”的 站 点 就 可 
以 直接 忽略 这 个 事务 。 协 调 者 收 到 所 有 参与 者 的 回答 后 ， 它 就 做 出 是 否 提交 事务 的 决定 。 只 要 
有 一 个 参与 者 建议 撤销 ， 协 调 者 就 必须 从 整体 上 撤销 整个 分 布 式 事务 ， 因 此 它 写 入 一 条 撤销 记 
录 ， 并 给 所 有 参与 者 发 送 “ 全 局 撤销 ”消息 ， 然 后 进入 撤销 状态 ， 否 则 ， 它 写 入 提交 记录 ， 给 
所 有 的 参与 者 发 送 “ 全 局 提交 ”消息 ， 然 后 进入 提交 状态 。 

第 二 阶段 是 执行 阶段 ， 目 的 是 实现 这 个 协调 者 的 决定 。 根 据 协调 者 的 指令 ， 参 与 者 或 者 提 
交 事 务 ， 或 者 撤销 事务 ， 并 给 协调 者 发 送 确认 消息 。 此 时 ， 协 调 者 在 日 志 中 写 入 一 条 事务 结束 
记录 并 终止 事务 。 图 12-6 描述 了 两 阶段 提交 协议 的 参与 者 和 协调 者 的 交互 。 

请 注意 协调 者 做 出 事务 的 全 局 终止 决定 的 方式 ， 该 决定 受 两 条 规则 的 支配 ， 这 两 条 规则 称 
为 全 局 提交 规则 。 


第 12 章 “数据库 发 展 和 新 技术 “ 国 51 荐 


(1) 只 要 有 一 个 参与 者 撤销 事务 ， 协 调 者 就 必须 做 出 全 局 撤销 决定 。 

(2) 只 有 所 有 参与 者 都 同意 提交 事务 ， 协 调 者 才能 做 出 全 局 提交 决定 。 

从 图 12-7 中 可 以 看 出 以 下 一 些 关 于 两 阶段 提交 协议 的 一 些 重要 之 处 。 

(1) 两 阶段 提交 协议 允许 参与 者 可 以 单方 面 撤销 事务 。 

(2) 一 旦 参与 者 确定 了 提交 或 撤销 提议 ， 就 不 能 再 更 改 它 的 提议 。 

(3) 当 参 与 者 处 于 就 绪 状 态 时 ， 根 据 协调 者 发 出 的 消息 的 种 类 参与 者 可 以 转换 为 提交 状态 

(4) 协调 者 依据 全 局 提交 规则 做 出 全 局 终止 决定 。 

(5) 注意 协调 者 和 参与 者 可 能 进入 某 些 相互 等 待 对 方 发 送 消息 的 状态 。 为 了 确保 它们 能 够 
从 这 些 状 态 中 退出 并 终止 ， 要 使 用 定时 器 。 每 个 代理 进程 进入 一 个 状态 时 都 要 设置 超时 器 。 如 
果 所 期 待 的 消息 在 定时 器 超时 之 前 没有 到 来 ， 定 时 器 向 代理 进程 报警 ， 进 程 根据 超时 协议 执行 
相应 动作 。 


协调 者 参与 者 


准备 提交 ee Cm ) 
写 begin_commit 2 __----| 号 abor 到 日 志 准备 提交 ? 
- 竹 议 提交 


写 ready 到 日 志 
eA 
No 


写 commit 到 日 志 


_ 全 局 


写 abort 介 日 志 


写 end_trans 到 日 志 


确认 


图 12-7 两 阶段 提交 协议 活动 图 
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6 两 阶段 提交 协议 对 故障 的 恢复 


1) 场地 故障 

(1) 当 一 参与 者 在 写 入 “建议 提交 ”前 发 生 故 障 时 ， 该 参与 者 无 法 向 协调 者 发 回答 信息 ， 
因此 ， 当 协调 者 等 待 超时 后 ， 将 决定 终止 事务 。 当 该 故障 恢复 后 ， 该 参与 者 无 须 收集 其 他 场地 
的 信息 即 可 终止 事务 。 

(2) 参与 者 进程 在 写 入 “建议 提交 ”后 发 生 故 障 ， 这 时 其 他 的 参与 者 可 以 正常 地 结束 该 事 
务 ,“ 提 交 ” 或 “撤销 ”因为 协调 者 可 以 根据 收 到 该 参与 者 的 应 答 决 定 “ 提 交 ” 或 “撤销 ”。 
因此 ， 故 障 恢复 后 ， 该 参与 者 要 访问 协调 者 或 其 他 参与 者 ， 以 了 解 协调 者 对 事务 做 出 的 决定 ， 
然后 执行 相应 的 操作 “提交 ”或 “撤销 ”。 这 里 我 们 假设 在 日 志 中 写 入 “建议 提交 ”记录 和 发 
送 “ 建 议 提交 ”信息 给 协调 者 这 两 个 动作 具有 原子 性 ， 要 么 都 执行 ， 要 么 都 不 执行 。 

(3) 协调 者 在 日 志 中 写 入 “准备 提交 ”记录 后 ， 写 入 “全 局 提交 ”或 “全 局 撤销 ”前 发 和 
故障 ， 这 时 已 发 出 “建议 提交 ”信息 的 参与 者 等 待 协 调 者 恢复 。 协 调 者 的 重启 动 过 程 从 头 恢 
提交 协议 ， 从 “准备 提交 ”记录 中 读 出 参与 者 的 标识 符 ， 重 发 “准备 提交 ” 报 文 给 参与 者 ， 
新 执行 提交 过 程 。 

(4) 协调 者 在 写 入 “全 局 提交 ”或 “全 局 撤销 ”记录 以 后 ， 在 写 入 “事务 结束 ”记录 以 前 
发 生 故 障 。 在 这 种 情况 下 ， 协 调 者 恢复 时 必须 给 所 有 的 参与 者 重 发 其 决定 ， 未 收 到 信息 的 参与 
者 不 得 不 等 待 协调 者 的 恢复 。 

2) 报 文 丢失 故障 

(1) 至 少 有 一 个 参与 者 的 回答 报 文 “建议 提交 ”或 “建议 撤销 ”) 丢失 了 。 在 这 种 情况 下 、 
协调 者 将 等 待 回答 而 超时 ， 整 个 事务 被 撤销 。 这 种 情况 只 由 协调 者 发 现 ， 但 它 无 法 决定 是 场地 
故障 还 是 通信 故障 ， 而 参与 者 能 够 正确 执行 ， 它 不 会 启动 恢复 过 程 。 

(2) 丢失 “准备 提交 ” 报 文 ， 由 于 至 少 有 一 个 参与 者 收 不 到 “准备 提交 ”命令 ， 因 此 参与 
者 处 于 等 待 状态 ， 而 协调 者 也 等 待 参与 者 的 回答 ， 所 以 协调 者 会 因为 等 待 超时 而 撤销 事务 。 这 
种 情况 和 上 述 一 样 。 

(3) 丢失 “全 局 提交 ”或 “全 局 撤销 ” 报 文 ， 这 种 情况 下 参与 者 处 于 等 待 协 调 者 命令 的 状 
态 下 ， 当 参与 者 未 收 到 命令 时 ， 会 因 等 待 而 超时 ， 这 时 向 协调 者 请 求 重 发 该 命令 的 信息 。 

(4) 丢失 了 “确认 ” 报 文 ， 当 协调 者 未 收 到 全 部 参与 者 的 “确认 ” 报 文 时 ， 协 调 者 会 因 等 
待 而 超时 ， 这 时 协调 者 重 发 命令 报 文 给 参与 者 ， 这 时 参与 者 必须 给 予 “ 确 认 ” 报 文 回答 ， 即 使 
此 时 相应 的 子 事务 已 不 在 活动 也 要 重 发 。 

3) 网 络 分 割 故障 

假设 在 出 现 网 络 分 割 时 ， 整 个 网 被 分 为 两 个 组 ， 包 含 协调 者 的 组 称 为 协调 者 组 ， 其 他 的 则 
组 成 参与 者 组 。 这 种 情况 对 于 协调 者 来 说 相当 于 参与 者 组 中 的 多 个 参与 者 同时 发 生 故 障 ， 这 时 


此 


局 洽 


协调 者 可 以 做 出 决定 ， 然 后 把 命令 发 给 协调 者 组 中 的 参与 者 ， 因 
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此 这 些 场地 上 的 子 事务 可 以 结 


束 。 而 对 于 失去 联系 的 参与 者 ， 它 们 则 认为 协调 者 出 现 故障 ， 根 据 它 们 所 缺少 的 


行 相应 的 故障 处 理 。 
7. 三 阶段 提交 协议 


可 答 信息 ， 进 


所 谓 事务 的 阻塞 是 指 一 个 场地 的 子 事务 本 来 是 可 以 执行 结束 的 ， 然 而 由 于 分 布 式 数据 库 的 
故障 ， 它 必须 等 待 故障 恢复 以 后 得 到 需要 的 信息 后 才 可 以 做 出 决定 ， 而 故障 情况 是 不 可 以 预料 
的 ， 该 子 事务 又 占有 一 些 系统 资源 不 能 释放 ， 无 法 继续 执行 ， 这 时 称 之 为 事务 进入 阻塞 状态 。 

事务 出 现 阻塞 的 原因 可 能 很 多 ， 例 如 : 即 当 参 与 者 等 待 协调 者 的 回答 时 ， 可 能 因为 网 络 故 
障 或 协调 者 故障 使 之 收 不 到 回答 信息 而 出 现 等 待 超 时 ， 这 时 事务 进入 阻塞 状态 ， 重 发 “建议 提 
交 ” 信 息 ， 要 求 协调 者 给 予 回 答 ， 直 到 网 络 故 障 或 协调 者 恢复 并 给 予 回 答 ， 参 与 者 才 做 出 决定 
继续 执行 《提交 或 撤销 )， 若 一 直 收 不 到 回答 ， 则 事务 一 直 处 于 阻塞 状态 而 挂 在 相应 的 场地 上 ， 


因此 ， 阻 塞 降低 了 事务 的 可 用 性 。 


如 何 使 一 个 提交 协议 成 为 非 阻塞 的 提交 协议 呢 ?在 2PC 协议 中 ， 参 与 者 的 提交 是 在 它 知道 
了 其 他 所 有 的 参与 者 均 发 出 了 “建议 提交 ”的 报 文 以 后 进行 的 。 若 在 2PC 中 增加 一 段 使 得 参与 
者 的 提交 不 仅 要 等 到 它 知 道 所 有 的 参与 者 均 发 出 了 “建议 提交 ”的 报 文 ， 而 且 还 知道 所 有 参与 
者 的 状态 (如 它们 是 处 于 故障 状态 ， 还 是 已 经 恢复 ) 以 后 才 执 行 。 这 时 2PC 即 变 成 3PC 协议 ， 
即 三 阶段 提交 协议 。 在 3PC 协议 中 ， 报 文 有 三 次 接收 和 发 送 ， 协 调 者 第 二 次 向 参与 者 发 出 的 报 
文 不 是 “全 局 提交 ” 报 文 ， 而 是 提交 前 的 “全 局 预 提交 ” 报 文 ， 告 诉 所 有 的 参与 者 均 可 以 进入 
准备 提交 状态 ， 而 参与 者 的 回答 也 不 是 提交 子 事务 ， 而 是 发 出 “准备 就 绪 ” 报 文 。 在 第 三 阶段 
中 ， 当 协调 者 收 到 全 部 的 “准备 就 绪 ” 的 回答 时 才 向 所 有 的 参与 者 发 “全 局 提交 ” 报 文 。 此 时 ， 


所 有 的 参与 者 均 知道 其 他 的 参与 者 已 经 进入 “准备 提交 ”状态 。 达 到 这 一 点 ， 每 个 参与 者 均 可 
生 


以 自己 做 出 决定 ， 撤 销 或 提交 ， 而 不 必 因 等 待 协调 者 的 回答 而 进入 阻塞 状态 ， 因 为 


故障 ， 系 统 的 恢复 机 制 迟 早 会 恢复 到 故障 前 一 刻 的 状态 ， 即 各 参与 者 的 子 事务 总 会 提交 。 因 此 ， 


即使 此 时 发 


参与 者 可 以 自行 决定 先 执行 下 去 而 不 是 处 于 等 待 状态 ， 从 而 减少 了 阻塞 。3PC 协议 的 操作 过 程 


如 下 。 


第 一 阶段 ， 协 调 者 向 所 有 的 参与 者 发 “准备 提交 ” 报 文 ， 由 每 个 参与 者 据 自 己 的 情况 进行 
投票 ， 只 有 所 有 的 参与 者 回答 “建议 提交 ” 才 进 入 第 二 阶段 。 
第 二 阶段 ， 协 调 者 向 所 有 的 参与 者 发 “全 局 预 提交 ” 报 文 ， 参 与 者 收 到 该 报 文 后 若 已 经 准 


备 好 提交 ， 则 回答 “准备 就 绕 ” 报 文 ， 否 则 进行 撤销 处 理 。 


第 三 阶段 ， 协 调 者 收 到 所 有 的 参与 者 “准备 就 绪 ” 回 答 后 ， 就 向 所 有 的 参与 者 发 “全 局 提 


交 ” 报 文 ， 此 时 每 个 参与 者 都 知道 其 他 的 参与 者 赞成 提交 ， 
后 进行 提交 。 


因此 它 可 以 收 到 “全 


局 提交 ” 报 文 
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3PC 可 以 避免 阻塞 是 基于 一 定 的 故障 模型 的 ， 如 果 发 生 了 网 路 分 割 故障 ， 采 用 3PC 协议 同 
样 存在 问题 ， 没 有 一 种 协议 能 够 解决 所 有 的 故障 ，3PC 协议 仅仅 是 降低 了 阻塞 发 生 的 可 能 性 ， 
但 不 是 完全 的 非 阻塞 协议 。 


8. 三 阶段 提交 协议 对 故障 的 恢复 


由 于 系统 的 故障 ， 报 文 可 能 没有 收 到 。 与 2PC 一 样 ，3PC 也 采用 超时 方法 处 理 。 

第 一 种 情况 是 协调 者 没 能 及 时 发 出 “准备 提交 ” 报 文 ， 导 致 参与 者 等 待 超时 ， 这 时 参与 者 
决定 撤销 。 

第 二 种 情况 是 协调 者 等 待 参与 者 投票 结果 超时 ， 这 时 协调 者 决定 撤销 。 

第 三 种 情况 是 参与 者 处 于 “赞成 ”提交 状态 ， 等 待 “ 全 局 预 提 交 ” 命 令 时 出 现 超 时 ， 这 时 
进入 恢复 处 理 过 程 。 

第 四 种 情况 是 参与 者 处 于 “准备 就 绪 ” 状 态 等 待 协调 者 的 “全 局 提交 ”命令 出 现 超时 ， 也 
进入 恢复 处 理 ， 这 时 只 要 有 至 少 一 个 参与 者 处 于 活动 状态 ， 子 事务 就 不 会 阻塞 。 因 为 恢复 后 的 
参与 者 可 以 从 活动 子 事务 得 到 有 关 提 交 处 理 的 信息 ， 从 而 得 知 协调 者 的 决定 ， 依 据 协调 者 的 决 
定 确定 自己 应 做 的 处 理 。 

事务 在 进入 恢复 前 有 下 述 的 两 种 状态 是 不 相 容 的 。 

(1) 一 个 参与 者 在 其 他 任何 一 个 活动 的 参与 者 处 于 赞成 提交 状态 时 ， 不 可 能 进入 “提交 ”状态 。 

(2) 一 个 参与 者 在 另 一 个 参与 者 进入 提交 状态 或 任何 一 个 参与 者 都 进入 准备 就 绪 状 态 时 不 
能 进入 撤销 状态 。 
因此 ， 恢 复 时 参与 者 可 以 根据 活动 事务 的 状态 决定 相应 的 处 理 。 在 3PC 协议 中 ， 恢 复 机 制 
唯一 可 以 做 的 是 就 近 访 问 一 个 活动 的 参与 者 ， 确 切 地 说 访问 在 它 进 入 恢复 处 理 前 最 近 的 活动 参 
与 者 。 如 果 所 有 的 参与 者 处 于 “赞成 ”提交 或 “撤销 ”状态 ， 则 肯定 没有 一 个 参与 者 已 提交 ， 
因此 可 以 通知 全 部 参与 者 “撤销 ”。 如 果 已 经 有 一 个 参与 者 “准备 就 绪 ” 或 “提交 ” 则 肯定 没 
有 一 个 参与 者 被 “撤销 ”， 所 以 可 以 通知 全 部 参与 者 提交 ， 在 通知 “全 局 提交 ”前 应 先 将 仍 处 
于 “赞成 ”提交 的 参与 者 进入 “准备 提交 ”状态 ， 然 后 再 进入 “提交 ”状态 。 因 为 在 通知 提交 
前 ， 任 何 一 个 参与 者 均 可 能 再 发 生 故 障 ， 所 以 应 避免 其 中 一 个 参与 者 处 于 “赞成 ”提交 状态 而 
另 一 个 处 于 “提交 ”状态 。 


12.1.5 ”新 型 分 布 式 海量 数据 库 


随 着 大 数据 和 云 计算 时 代 的 到 来 ， 海 量 数 据 每 年 都 在 呈 指 数 级 爆炸 性 增长 ， 传 统 的 分 布 式 
数据 库 模式 处 理 起 来 也 越 来 越 吃力 ， 新 的 分 布 式 海量 数据 库 管 理 和 组 织 方法 应 运 而 生 ， 典 型 的 
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就 是 Google 基于 其 分 布 式 文件 系统 (Google File System，GFS) 和 MapReduce 计算 框架 之 上 
实现 的 BigTable 分 布 式 存储 和 管理 机 制 。BigTable 非常 适合 PB 以 上 级 数据 的 处 理 ， 每 秒 可 以 
处 理 百 万 级 以 上 的 读 写 操作 ， 具 有 很 好 的 高 可 用 、 高 可 靠 和 高 效 性 。 

Bigtable 是 一 种 稀疏 、 分 布 式 、 持 久 化 存储 的 多 维度 排序 映射 .映射 由 键 (Key) 和 值 (Volume) 
构成 。BigTable 使 用 行 和 列 名 称 对 数据 进行 索引 ， 这 些 名 称 可 以 是 任意 字符 串 。Bigtable 的 键 
有 三 维 ， 分 别 是 行 键 (Row Key)、 列 键 (Column Key) 和 时 间 戳 (Timestamp)， 行 键 和 列 键 都 
是 字 节 串 ， 时 间 戳 是 64 位 整 型 ， 而 值 是 一 个 字 节 串 。 可 以 用 (row:string，column:string， 
time:int64) 一 string 来 表示 一 条 键 值 对 记录 。 

BigTable 依赖 一 个 高 可 用 的 、 持 久 性 的 分 布 式 锁 服 务 Chubby。 一 个 Chubby 服务 包含 5 个 
动态 副本 ， 其 中 一 个 被 选 作 主 副本 对 外 提供 服务 。 当 大 部 分 副本 处 于 运行 状态 并 且 能 够 彼此 通 
信 时 ， 这 个 服务 就 是 可 用 的 。Chubby 使 用 Paxos 算法 来 使 它 的 副本 在 失败 时 保持 一 致 性 。 关 于 
BigTable 更 多 的 实现 细节 参见 12.6 节 。 


12.2” Web 与 数据 库 


随 着 网 络 的 高 速 发 展 和 网 络 服务 的 日 趋 完善 ， 网 络 上 的 信息 量 呈 几何 级 数 增加 。 为 了 有 效 
地 组 织 、 存 储 、 管 理 和 使 用 网 上 的 信息 ， 数 据 库 技术 被 普遍 地 应 用 于 网 络 领域 。20 世纪 90 年 
代 的 数据 库 技术 已 经 十 分 成 熟 ， 可 以 支持 大 容量 数据 的 存储 和 检索 ， 而 且 具 有 较 高 的 稳定 性 和 
可 靠 性 。 


12.2.1 ”Web 概述 


1，Web 数据 库 


数据 库 是 指 按照 一 定 的 结构 和 规则 组 织 起 来 的 相关 数据 的 集合 ， 是 存放 数据 的 “仓库 ”， 
据 此 将 网 络 数据 库 定义 为 以 后 台数 据 库 为 基础 的 ， 加 上 一 定 的 前 台 程序 ， 通 过 浏览 器 完成 数据 
存储 、 查 询 等 操作 的 系统 。 数 据 库 技术 是 计算 机 处 理 与 存储 数据 的 最 有 效 、 最 成 功 的 技术 ， 而 
计算 机 网 络 的 特点 是 资源 共享 ， 因 此 数据 与 资源 共享 这 两 种 技术 的 结合 即 成 为 今天 广泛 应 用 的 
Web 数据 库 〈 也 叫 网 络 数据 库 )。 

一 个 Web 数据 库 就 是 用 户 利用 浏览 器 作为 输入 接口 ,输入 所 需要 的 数据 , 浏览 器 将 这 些 数 
据 传送 给 网 站 ， 由 网 站 对 这 些 数 据 进行 处 理 。 例 如 ， 将 数据 存 入 后 台数 据 库 ， 或 者 对 后 台数 据 
库 进 行 查 询 操作 等 。 最 后 网 站 将 操作 结果 传 回 给 浏览 器 ， 通 过 浏览 器 将 结果 告知 用 户 。 网 站 上 
的 后 台数 据 库 就 是 Web 数据 库 。 
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2. WWW 网 络 环境 下 的 Web 数据 库 


Web 与 数据 库 的 互 连 ， 将 人 人、 企业、 社会 与 ntemet 融 为 一 体 。Web 技术 发 展 到 今天 ， 人 
们 已 经 可 以 把 数据 库 技术 引入 到 Web 系统 中 。 数据 库 技术 发 展 比较 成 熟 , 特别 适用 于 对 大 量 的 
数据 进行 组 织 管理 ，Web 技术 具有 较 佳 的 信息 发 布 途径 ， 这 两 种 技术 的 天 然 互补 性 决定 相互 融 
合 是 其 发 展 的 必然 趋势 。 将 Web 技术 与 数据 库 技术 融合 在 一 起 ， 使 数据 库 系统 成 为 Web 的 重 
要 有 机 组 成 部 分 ， 不 仅 可 以 把 二 者 的 所 有 优点 集中 在 一 起 ， 而 且 能 够 充分 利用 大 量 已 有 的 数据 
库 信 息 资源 ， 使 用 户 在 Web 浏览 器 上 方便 地 检索 和 浏览 数据 库 的 内 容 ， 这 对 许多 软件 开发 者 来 
说 具有 极 大 的 吸引 力 。 因 此 ， 将 Web 技术 与 数据 库 相 结合 ， 开 发 动态 的 Web 数据 库 应 用 已 成 
为 当今 Web 技术 研究 的 热点 。 

关系 数据 库 最 初 设计 为 基于 主机 /终端 方式 的 大 型 机 上 的 应 用 ,其 应 用 范围 较为 有 限 ， 随 着 
客户 机 /服务 器 方式 的 流行 和 应 用 向 客户 机 方向 的 分 解 ， 关 系数 据 库 又 经 历 了 客户 机 /服务 器 时 
代 ， 并 获得 了 极 大 的 发 展 。 

随 着 Internet 应 用 的 普及 ,由 于 Internet 上 信息 资源 的 复杂 性 和 不 规范 性 ,关系 数据 库 初 期 
在 开发 各 种 网 上 应 用 时 显得 力不从心 ， 表 现在 无 法 管理 各 种 网 上 的 复杂 的 文档 型 和 多 媒体 型 数 
据 资源 ， 后 来 关系 数据 库 对 于 这 些 需 求 做 出 了 一 些 适应 性 调整 ， 如 增加 数据 库 的 面向 对 象 成 分 
以 增加 处 理 多 种 复杂 数据 类 型 的 能 力 , 增加 各 种 中 间 件 (主要 包括 CGI、 ISAPI、 ODBC、 JDBC、 
ASP 等 技术 ) 以 扩展 基于 Internet 的 应 用 能 力 ， 通 过 应 用 服务 器 解释 执行 各 种 HTML 中 嵌入 脚 
本 来 解决 Internet 应 用 中 数据 库 数据 的 显示 、 维 护 、 输 出 以 及 到 HTML 的 格式 转换 等 。 

此 时 关系 数据 库 的 基于 Internet 应 用 的 模式 典型 表现 为 一 种 三 层 或 四 层 的 多 层 结 构 。 在 这 
种 多 层 结构 体系 下 ， 关 系数 据 库 解 决 了 数据 库 的 Internet 应 用 的 方法 问题 ， 使 得 基于 关系 数据 
库 能 够 开发 各 种 网 上 数据 库 数据 的 发 布 、 检 索 、 维 护 、 数 据 管 理 等 一 般 性 应 用 。 

但 是 关系 数据 库 从 设计 之 初 并 没有 也 不 可 能 考虑 到 以 http 为 基础 、HTML 为 文件 格式 的 互 
联网 的 需求 ， 只 是 在 互联 网 出 现 后 才 做 出 相应 的 调整 。 同 时 ， 关 系数 据 库 的 基于 中 间 件 的 解决 
方案 又 给 Internet 应 用 带 来 了 新 的 网 络 瓶颈 ， 应 用 服务 器 端 由 于 与 数据 库 频 繁 交 互 ， 因 其 本 身 
的 效率 和 数据 库 检 索 的 效率 造成 nternet 应 用 在 应 用 服务 器 端的 阻塞 。 

虽然 关系 型 数据 库 具有 完备 的 理论 基础 、 简 洁 的 数据 模型 、 透 明 的 查询 语言 和 方便 的 操 
作 方 法 等 优点 ， 但 是 由 于 它 本 身 并 没有 针对 网 络 的 特点 和 要 求 进行 设计 ， 因 此 并 不 适用 于 网 络 
环境 ,我 们 应 该 研究 开发 新 的 数据 库 技 术 ， 从 开始 就 考虑 到 Web 的 信息 和 结构 特点 ， 使 数据 库 
真正 能 与 Web 融合 为 一 体 ， 充 分 利用 二 者 的 特点 ， 建 立 合理 的 Web 数据 库 。 

Web 数据 库 可 以 实现 方便 廉价 的 资源 共享 。 数 据 信 息 是 资源 的 主体 ， 因 而 网 络 数据 库 技术 
自然 而 然 成 为 互联 网 的 核心 技术 。 当 前 比较 流行 的 Web 数据 库 主要 有 : SQL Server、Oracle 和 
MySQL 等 。 这 几 种 数据 库 适 应 性 强 ， 性 能 优异 ， 容 易 使 用 ， 在 国内 得 到 了 广泛 的 应 用 。 
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12.2.2 ”Web 服务 器 脚本 程序 与 服务 器 的 接口 


Web 页 面 与 数据 库 的 连接 是 Web 数据 库 的 基本 要 求 。 目 前 基于 Web 数据 库 的 连接 方案 主 


t 


要 有 两 种 类 型 : 服务 器 端 和 客户 端 方案 。 服 务 器 端 方案 实现 技术 有 CGI、SAPI、ASP、PHP、 
JSP 等 ; 客户 端 方案 实现 技术 有 JDBC (Java Database Connectivity)、DHTML (Dynamic HTML) 
等 。 其 中 ASP 是 微软 开发 的 脚本 语言 技术 , 它 嵌入 在 IS 中 , 因此 ASP 也 就 顺理成章 地 成 为 大 
部 分 Windows 用 户 首选 的 脚本 语言 。 


通常 ，Web 数据 库 的 环境 


硬件 和 软件 组 成 。 硬 件 包 括 Web 服务 器 、 客 户 机 、 数 据 库 服 


务 器 、 网 络 。 软 件 包括 客户 端 必须 有 能 够 解释 执行 HTML 代码 的 浏览 器 (如 正 、Firefox 和 Chrome 
等 ); 在 Web 服务 器 中 , 必须 具有 能 执行 可 以 自动 生成 HTML 代码 的 程序 的 功能 , 如 ASP、CGI 
等 ， 具 有 能 自动 完成 数据 操作 指令 的 数据 库 系统 ， 如 Access、SQL Server 等 。 

Web 服务 器 使 用 HTTP 协议 对 客户 机 的 请 求 给 予 回答 。 一 个 Web 服务 器 在 Internet 上 都 有 
唯一 的 地 址 ， 这 个 地 址 可 以 是 一 个 域名 ， 也 可 以 是 一 个 IP 地 址 。 例 如 www.yahoo.com 或 
202.106.168.67。Web 服务 器 的 种 类 很 多 ， 比 较 著名 的 有 IIS 和 Apache 等 。 

12-8 给 出 了 典型 的 Web 和 数据 库 的 运行 模式 。 


数据 库 服务 器 


数据 库 管理 系统 


Internet 客户 机 


图 12-8 Web 和 数据 库 的 运行 模式 图 


在 脚本 程序 中 连接 数据 库 一 般 都 需要 相应 的 接口 来 完成 。 连 接 数 据 库 的 常用 方法 有 : 
ODBC、DAO、RDO 及 ADO 等 。 
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(1) ODBC (Open Database Connectivity， 开 发 式 数据 库 连 接 ) 是 微软 开发 的 一 套 统一 的 程 
序 接口 。 通 过 这 个 接口 可 以 存 取 不 同 厂商 生产 的 数据 库 。 经 过 多 年 的 改进 ， 它 已 成 为 存 取 服 务 
数据 库 的 标准 。 事 实 上 ，ODBC 技术 成 了 后 来 DAO、RDO 及 ADO 等 数据 库 访问 技术 的 基础 。 

(2) DAO (Data Access Objects， 服 务 器 访问 对 象 ) 是 微软 公司 开发 的 一 套 主要 应 用 程序 
及 开发 工具 ， 用 它 可 以 访问 数据 库 的 标准 对 象 ， 如 Access、VB、Excel、Word 等 。 

(3) RDO (Remote Data Objects， 远 程 数据 库 访问 对 象 ) 是 微软 公司 为 增强 DAO 的 功能 而 
推出 的 新 产品 。 该 产品 强化 了 SQL Server 的 访问 功能 ， 提 高 了 它 的 执行 效率 。 

(4) ADO (ActivteX Data Objects，ActivteX 数据 对 象 ) 是 微软 在 Internet 领域 采取 的 新 举 
措 。 它 本 身 并 不 是 一 项 新 技术 ， 从 对 象 结构 的 角度 来 看 ， 它 比 DAO 提供 的 对 象 更 少 ， 从 存 取 
SQL 服务 器 的 角度 来 看 , 它 提供 的 功能 也 不 如 RDO。 但 它 汲 取 了 DAO 和 了 DO 最 精华 的 部 分 ， 
成 为 一 个 更 适合 于 Internet 的 小 而 精 的 对 象 群 。 因 此 ，ADO 实际 上 是 脚本 程序 连接 数据 库 的 一 
种 选择 。 


12.2.3 “CGI 的 应 用 


公共 网 关 接 口 (Common Gateway Interface，CGI) 是 最 早出 现 的 动态 发 布 网 页 技术 ， 由 于 
其 开发 较 早 ， 技 术 成 熟 ， 因 此 目前 仍 是 动态 网 页 开发 的 主力 之 一 。Common 表示 确保 CGI 可 以 
使 用 多 种 程序 语言 和 多 种 不 同 的 系统 交互 ，Gateway 表示 CGI 的 力量 不 在 于 它 本 身 所 做 的 事 ， 
而 在 于 它 提供 了 连接 其 他 系统 的 潜力 ， 例 如 数据 库 和 图 形 生 成 工具 等 ，Interface 表示 CGI 对 如 
何 更 好 地 利用 其 特性 提供 了 明确 的 定义 ， 换 句 话 说 ， 可 以 设计 程序 来 适当 利用 这 个 接口 。CGI 
是 Web 服务 器 调用 外 部 程序 的 接口 。 通 过 CGI, Web 服务 器 能 完成 一 些 本 身 所 不 能 完成 的 工作 。 
早期 很 多 著名 的 服务 器 都 以 自己 独特 的 方式 ， 支 持 服务 器 端的 可 执行 程序 ， 用 来 帮助 完成 客户 
机 的 请 求 。 为 某 个 服务 器 写 的 程序 要 在 其 他 服务 器 一 同 使 用 时 ， 就 必须 做 较 大 的 修改 ， 原 因 是 
每 个 服务 器 与 可 执行 程序 之 间 传递 信息 的 内 容 和 方式 都 不 尽 相 同 。 为 此 就 形成 了 一 个 公共 标准 
CGI， 使 得 为 一 个 服务 器 写 的 程序 能 够 在 任何 服务 器 上 运行 。 通 过 这 个 公共 网 关 接口 ， 服 务 器 
可 以 向 CGI 程序 发 送信 息 ，CGI 程序 也 可 以 向 服务 器 发 送信 息 。 可 以 使 用 C Shell、Perl、C、 
C++、Fortran 和 数据 库 语 言 等 任何 能 够 形成 可 执行 程序 的 语言 编写 。 
如 果 现 在 要 让 Web 服务 器 与 其 他 系统 结合 ， 比 如 后 台数 据 库 系统 ， 则 CGI 程序 会 起 到 程 
序 接口 的 作用 ， 将 接收 到 的 参数 进行 预 处 理 ， 转 换 成 所 要 结合 的 数据 库 系统 能 够 识别 的 形式 ， 
对 于 数据 库 系统 而 言 , 常常 就 是 指数 据 库 系 统 能 够 识别 运行 的 标准 的 SQL 语句 。 当 其 他 系统 完 
成 数据 处 理 后 如 果 有 结果 返回 ， 则 CGI 程序 获得 并 处 理 其 他 系统 所 传 回 的 数据 ,然后 将 其 按 一 
定 的 标准 格式 再 送 回 至 Web 服务 器 ， 由 Web 服务 器 以 网 页 的 形式 传 回 到 客户 端 。 为 了 灵活 使 
用 各 种 数据 库 系 统 ，CGI 程序 支持 ODBC 方式 。CGI 程序 不 直接 访问 数据 库 系 统 ， 而 是 通过 
ODBC 数据 库 接口 管理 器 实现 。 应 用 程序 以 标准 SQL 语句 访问 ODBC，ODBC 由 不 同 的 数据 
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库 所 提供 的 ODBC 驱动 程序 将 SQL 语句 转换 成 本 数据 库 所 能 执行 的 语言 ， 然 后 访问 数据 库 。 

当 数据 库 将 结果 返回 ODBC 时 ，ODBC 同样 将 返回 结果 进行 预 处 理 ， 以 标准 形式 返回 给 CGI 
程序 。 这 样 使 用 ODBC 方式 访问 数据 库 的 优点 是 程序 员 在 开发 系统 时 不 必 考虑 后 台数 据 库 的 类 
型 ， 只 要 以 标准 SQL 语句 编写 数据 库 查 询 语句 访问 ODBC 数据 库 接口 ， 由 ODBC 来 负责 对 各 
种 数据 库 的 支持 。 不 论 是 使 用 大 型 数据 库 ， 还 是 小 型 数据 库 ， 开 发 人 员 都 不 必 更 改 CGI 程序 。 
这 样 就 给 系统 的 开发 、 维 护 和 升级 都 带 来 很 大 的 方便 和 灵活 性 。 


12.2.4 ASP 的 应 用 


ASP, 全 称 Active Server Page, 它 提供 了 一 个 在 服务 器 端 执行 脚本 指令 的 环境 (包括 HTML、 
VBScript 和 JavaScript 等 )， 通 过 这 种 环境 ， 用 户 可 以 创建 和 运行 动态 的 Web 应 用 程序 。 由 于 
所 有 的 程序 都 在 服务 器 端 执行 ， 这 样 就 大 大 减轻 了 客户 端 浏览 器 的 负担 ， 提 高 了 交互 速度 。 利 
用 ASP 不 仅 能 够 产生 动态 的 、 交 互 的 、 高 性 能 的 Web 应 用 程序 ， 而 且 可 以 进行 复杂 的 数据 库 
操作 。ASP 本 身 包含 了 VBScript 和 JavaScript 的 引擎 ， 使 得 脚本 可 以 直接 嵌入 HTML 中 ， 而 且 
还 可 以 通过 ActiveX 控件 实现 更 为 强大 的 功能 。 
确切 地 说 ，ASP 并 不 是 一 种 语言 ， 它 所 使 用 的 语言 通常 是 VBScript 或 者 JavaScript， 通 过 
这 两 种 脚本 语言 ,我 们 能 够 很 方便 地 开发 ASP 应 用 .但 决 不 能 将 ASP 与 VBScript 或 者 JavaScript 
等 同 起 来 , VBScript 和 JavaScript 之 间 最 大 的 区 别 就 是 它们 的 结构 。 VBScript 是 Visual Basic 的 
子 集 ， 如 果 你 曾经 用 过 Visual Basic 或 者 是 Visual Basic for Applications (VBA)， 就 会 觉得 非常 
熟悉 。 不 过 它们 并 不 是 完全 一 样 的 ， 因 为 VBScript 是 特意 为 在 浏览 器 中 进行 工作 而 设计 的 ， 它 
不 包括 一 些 在 脚本 这 个 范围 以 外 的 特性 ,如 文件 访问 和 打印 等 。JavaScript 是 从 一 组 编程 语言 如 
C、C++ 以 及 Java 等 之 中 脱离 出 来 的 。 如 果 你 以 前 曾经 用 过 C 或 者 是 Java， 那 么 JavaScript 的 
结构 你 会 觉得 非常 熟悉 。 但 是 ，JavaScript 和 Java 是 完全 不 同 的 两 种 语言 。Java 是 一 种 网 页 应 
用 程序 和 非 网 页 应 用 程序 都 可 以 使 用 的 完全 成 熟 的 开发 语言 。 而 JavaScript 是 一 种 主要 用 于 脚 
本 编写 的 脚本 语言 。 

ASP 能 够 提供 六 个 内 建 对 象 ， 能 够 很 方便 地 实现 状态 保存 功能 ， 可 以 很 容易 地 从 客户 浏览 
器 获取 信息 ， 并 向 浏览 器 反馈 信息 ， 这 样 ， 我 们 就 能 够 很 方便 地 运用 ASP 开发 Web 应 用 。 

ASP 特点 有 以 下 几 个 特点 。 

(1) ASP 无 须 编译 ，ASP 脚本 集成 于 HTML 中 ， 无 须 编译 或 链接 即 可 直接 解释 执行 。 

(2) ASP 易于 生成 。 使 用 常规 文本 编辑 器 即 可 进行 页 面 的 设计 。 

(3) ASP 独立 于 浏览 器 。 用 户 端 只 要 使 用 可 解释 常规 HTML 码 的 浏览 器 ， 即 可 浏览 ASP 
所 设计 的 主页 。 

(4) ASP 脚本 是 在 站 点 服务 器 端 执行 的 ， 因 此 ， 若 不 通过 从 服务 器 下载 来 观察 ASP 主页 ， 
在 浏览 器 端 将 看 不 到 正确 的 页 面 内 容 。 
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(5) 在 ASP 脚本 中 可 以 方便 地 引用 系统 组 件 和 ASP 的 内 置 组 件 ， 还 能 通过 定制 ActiveX 


服务 器 组 件 来 扩充 功能 。 与 任何 ActiveX Scripting 语言 兼容 。 


(6) 源 程 序 码 不 会 外 漏 。ASP 脚本 在 服务 器 上 执行 ， 传 到 用 户 浏览 器 的 只 是 ASP 执行 结 


果 所 生成 的 常规 HTML 码 ， 这 样 可 保证 程序 代码 不 会 被 他 人 盗 取 。 


ASP 所 完成 的 功能 主要 如 下 。 
(1) 处 理由 浏览 器 传送 到 站 点 服务 器 的 表单 输入 。 
(2) 访问 和 编辑 服务 器 端的 数据 库 表 。 使 用 浏览 器 即 可 和 输入、 更 新 和 删除 站 点 的 数据 库 中 


的 数据 。 


足 自 


(3) 读 写 站 点 服务 器 的 文件 ， 实 现 访客 计数 器 等 功能 。 

(4) 取得 浏览 器 信息 管理 等 内 置 功能 。 

(5) 由 Cookies 读 写 用户 端 的 硬盘 文件 ， 以 记录 用 户 的 数据 。 

(6) 可 以 实现 在 多 个 主页 间 共 享 信息 ， 以 开发 复杂 的 商务 站 点 应 用 程序 。 

(7) 使 用 VBScript 或 JavaScript 等 简易 的 脚本 语言 ， 结 合 HTML， 快 速 完 成 站 点 的 应 用 程 
通过 站 点 解释 器 执行 脚本 语言 ， 产 生 或 更 改 在 客户 端 执行 的 脚本 语言 。 

(8) 扩充 功能 的 能 力 强 ， 可 通过 使 用 多 种 程序 语言 制作 的 ActiveX Server Component 以 满 
己 的 特殊 需要 。 

ASP 是 通过 ADO 的 对 象 模 块 来 存 取 数 据 库 ， 无 论 采用 什么 数据 库 ， 只 要 该 数据 库 具有 对 


应 的 ODBC 或 OLE DB 驱动 程序 ，ADO 对 象 就 能 加 以 存 取 。 事 实 上 ，ASP 提供 的 ADO 对 象 
模块 包含 了 下 列 6 个 对 象 和 3 个 集合 ， 其 中 Connection、Recordset、Command 和 Field 对 象 比 


较 党 


Connection 对 象 : 打开 或 关闭 数据 库 连 接 。 

Recordset 对 象 : 存 取 表 的 记录 ， 包 括 读 取 、 插 入 、 删 除 或 更 新 表 的 记录 。 
Fields 集合 : 表示 Recordset 对 象 所 包含 的 Field 对 象 的 集合 。 

Field 对 象 : 用 来 表示 表 的 某 一 条 记录 。 

Command 对 象 : 执行 查询 并 返回 条 件 符合 的 记录 (返回 值 为 Recordset 对 象 ) 。 
Parameter 集合 : 表示 Command 对 象 所 包含 的 参数 集合 。 

Parameter 对 象 : 用 来 表示 Command 对 象 所 需要 的 某 个 参数 。 

Errors 集合 : 表示 某 个 方法 调用 失败 所 产生 的 错误 集合 。 

Error 对 象 : 用 来 表示 方法 调用 失败 所 产生 的 某 个 错误 。 

ASP 的 工作 流程 如 下 。 

当 客户 端的 Web 浏览 器 访问 某 一 Web 站 点 时 ， 浏 览 器 将 URL 发 送 给 Web 服务 器 请 求 信 


息 ，Web 服务 器 返回 HTML 页 面 响应 。HTML 页 面 可 以 是 已 经 格式 化 并 存储 在 Web 节点 中 的 
静态 页 面 ， 也 可 以 是 服务 器 动态 创建 以 响应 用 户 所 提供 信息 的 页 面 ， 或 者 是 列 出 Web 节点 上 可 
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用 文件 和 文件 夹 的 页 面 。 

当 用 户 申请 一 个 ASP 主页 时 ，Web 服务 器 响应 该 HTTP 请 求 ， 解 释 被 申请 文件 。 当 过 腊 
任何 与 ActiveX Scripting 兼容 的 脚本 (如 VBScript 和 JavaScript) 时 ，ASP 引擎 会 调用 相应 的 
脚本 引擎 进行 处 理 。 若 脚本 指令 中 含有 访问 数据 库 的 请 求 就 通过 ODBC 与 后 台数 据 库 相 连 ， 
数据 库 访问 组 件 ADO 执行 访问 数据 库 操 作 。ASP 脚本 是 在 服务 器 端 解释 执行 的 ， 它 依据 访问 
数据 库 后 返回 的 结果 集 自动 生成 符合 HTML 语言 的 主页 , 去 响应 用 户 的 请 求 。 所 有 相关 的 工作 
都 由 Web 服务 器 负责 。 

在 结构 关系 上 ，ASP 是 通过 ODBC 与 数据 库 打交道 。 因 此 ， 向 上 可 兼容 各 类 数据 库 系 统 。 
而 对 于 下 层 ，ASP 产生 的 HTML 对 客户 端的 浏览 器 又 有 广泛 的 适应 性 。 但 ASP 对 Web 服务 器 
本 身 有 所 挑剔 ， 这 看 起 来 似乎 是 一 种 缺陷 ， 而 实际 上 也 许 是 一 种 商业 策略 一 一 它 只 支持 微软 各 
种 操作 系统 下 的 Web 服务 器 。 图 12-9 表示 了 ASP 的 工作 原理 。 


浏览 器 


文件 下 载 


Web 服务 器 
脚本 引擎 | ADO 对象 


ODBC 


图 12-9 ASP 工作 原理 图 


12.2.5 ”Servlet 和 JSP 的 应 用 


Servlet 是 一 种 Web 组 件 程序 ， 它 可 以 动态 地 生成 Web 内 容 ， 支 持 Web 应 用 的 HTTP 协议 
使 用 请 求 -响应 机 制 。 服 务 器 接收 、 处 理 请 求 并 返回 适当 的 响应 。Servlet 用 面向 对 象 的 方式 对 这 
一 过 程 建 模 ， 使 你 能 编写 代码 处 理 客户 的 请 求 并 能 动态 地 响应 。 例 如 ，Servlet 可 能 从 一 个 表单 
读 取 数据 并 用 它 更 新 公司 的 订单 数据 库 。Servlet 技术 在 通过 动态 HTML 页 面 扩展 Web Server 
上 呈现 出 一 种 强 有 力 的 方法 。 一 个 Servlet 就 是 一 个 运行 在 Web 服务 器 中 的 Java 程序 ，Servlet 
从 浏览 器 中 获取 一 个 HTTP 请 求 ， 生 成 动态 内 容 ( 例 如 查询 一 个 数据 库 )， 并 把 HTTP 的 响应 
返回 给 浏览 器 。 

在 Servlet 之 前 ，CGI 技术 被 用 在 动态 内 容 中 。 然 而 ， 由 于 它 的 结构 以 及 可 升级 性 的 限制 ， 
CGI 最 后 被 证 明 是 不 太 理想 的 解决 方案 。 

Servlet 技术 ， 在 可 升级 性 上 有 了 很 大 的 改善 ， 它 提供 了 公认 的 Java 平台 扩展 、 安 全 性 以 
及 强壮 性 等 方面 的 优点 。 
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Servlet 能 使 用 所 有 的 标准 Java APIs， 在 Java 领域 中 ，Servlet 技术 为 密集 型 应 用 程序 〔 比 
如 访问 一 个 数据 库 ) 提供 了 很 多 的 优点 。 优 点 之 一 就 是 Servlet 运行 在 服务 器 端 ， 服 务 器 端 具 有 
多 种 资源 且 属 于 一 个 相对 强壮 的 机 器 , 因此 占用 客户 端的 资源 相当 少 。 另 外 一 个 优点 就 是 Servlet 
在 访问 数据 时 更 加 直接 。 因 为 运行 Servlet 的 Web 服务 器 或 者 数据 服务 器 在 数据 被 访问 时 是 与 
网 络 防火 墙 在 一 端 。 

JSP 技术 由 sun 公司 提出 ， 利 用 它 可 以 很 方便 地 在 页 面 中 生成 动态 的 内 容 ， 使 网 络 应 用 程 
序 可 以 输出 多 姿 多 彩 的 动态 页 面 。JSP 技术 通常 与 Java Servlet 技术 相 结合 , 可 以 在 HTML 页 面 
或 者 其 他 标记 语言 中 内 风 Java 代码 段 并 且 调 用 外 部 Java 组 件 。 它 作为 一 个 前 端 处 理工 具 ， 可 
以 使 用 JavaBeans 实现 复杂 的 商业 逻辑 和 动态 功能 。 

JSP 代码 与 JavaScript 等 网 页 脚本 语言 是 不 同 的 ， 在 标准 的 HTML 页 面 中 可 以 出 现 的 任何 
内 容 都 可 以 在 JSP 页 面 中 出 现 。 

在 一 个 典型 的 数据 库 应 用 中 ，JSP 页 面 将 会 调用 某 些 JavaBean 组 件 ， 这 些 组 件 可 以 通过 
JDBC 或 者 SQLJ 直接 或 间接 地 访问 数据 库 。 

JSP 页 面 在 运行 之 前 要 被 解释 成 Java Servlet， 解 释 过 程 是 按 需 进行 的 ， 有 时 可 能 会 提前 进 
行 ， 然 后 它 可 以 处 理 HTTP 请 求 并 生成 响应 信息 ，JSP 技术 为 编写 Servlet 程序 提供 了 更 为 便利 
的 途径 。 

另外 ，JSP 页 面 和 Servlet 程序 是 可 以 相互 操作 的 ， 也 就 是 说 JSP 页 面 可 以 包含 从 Servlet 
程序 输出 的 内 容 ， 可 以 将 内 容 输出 到 Servlet 程序 ， 反 过 来 Servlet 程序 也 可 以 包含 从 JSP 页 面 
输出 的 内 容 ， 并 且 可 以 将 内 容 输出 到 JSP 页 面 中 。JSP 技术 的 最 大 优点 就 是 可 以 将 网 页 的 静态 
内 容 与 动态 内 容 开发 分 隔 开 来 ， 从 而 可 以 使 得 精通 HTML 但 对 Java 不 很 精通 的 开发 人 员 专 门 
负责 网 页 静态 内 容 的 开发 ， 而 那些 对 Java 很 在 行 但 却 不 熟悉 HTML 的 开发 人 员 就 可 以 专注 于 
网 页 的 动态 内 容 的 开发 。 


12.3 XML 与 数据 库 


12.3.1 什么 是 XML 


XML 代表 Extensible Markup Language 的 缩写 , 意 为 可 扩展 的 标记 语言 。 XML 是 一 套 定义 
语义 标记 的 规则 ， 这 些 标记 将 文档 分 成 许多 部 件 并 对 这 些 部 件 加 以 标识 。 它 也 是 元 标记 语言 ， 
即 定义 了 用 于 定义 其 他 与 特定 领域 有 关 的 、 语 义 的 、 结 构 化 的 标记 语言 的 句法 语言 。 

关于 XML 要 理解 的 第 一 件 事 是 ， 它 不 只 是 像 HTML 超 文 本 标记 语言 或 是 格式 化 的 程序 。 
这 些 语 言 定义 了 一 套 固定 的 标记 , 用 来 描述 一 定数 目的 元 素 。 如 果 标 记 语 言 中 没有 所 和 需 的 标记 ， 
用 户 也 就 没有 办 法 了 。 这 时 只 好 等 待 标记 语言 的 下 一 个 版 本 ， 希 望 在 新 版 本 中 能 够 包括 所 需 的 
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标记 ， 但 是 这 样 一 来 就 得 依赖 于 软件 开发 商 的 选择 了 。 但 是 XML 是 一 种 元 标记 语言 。 用 户 可 
以 定义 自己 需要 的 标记 。 这 些 标 记 必 须根 据 某 些 通用 的 原理 来 创建 ， 但 是 在 标记 的 意义 上 ， 也 
具有 相当 的 灵活 性 。 例 如 ， 假 如 用 户 正在 处 理 与 家 谱 有 关 的 事情 ， 需 要 描述 人 的 出 生 、 死 亡 、 
埋葬 地 、 家 庭 、 结 婚 、 离 婚 等 ， 这 就 必须 创建 用 于 每 项 的 标记 。 新 创建 的 标记 可 在 文档 类 型 定 
义 (Document Type Definition，DTD) 中 加 以 描述 。XML 定义 了 一 套 元 句法 ， 与 特定 领域 有 关 
的 标记 语言 都 必须 遵守 。 如 果 一 个 应 用 程序 可 以 理解 这 一 元 句法 ， 那 么 它 也 就 能 够 自动 地 理解 
所 有 的 由 此 元 语言 建立 起 来 的 语言 。 浏 览 器 不 必 事 先 了 解 多 种 不 同 的 标记 语言 使 用 的 每 个 标 
记 。 事 实 是 ， 浏 览 器 在 读 入 文档 或 是 它 的 DTD 时 才 了 解 了 给 定 文档 使 用 的 标记 。 关 于 如 何 显 
示 这 些 标记 的 内 容 的 详细 指令 是 附加 在 文档 上 的 另外 的 样式 单 提供 的 。 有 了 XML 就 意味 着 不 
必 等 待 浏览 器 的 开发 商 来 满足 用 户 的 需要 了 。 用 户 可 以 创建 自己 需要 的 标记 ， 当 需要 时 ， 告 诉 
浏览 器 如 何 显示 这 些 标记 就 可 以 了 。 

关于 XML 要 了 解 的 第 二 件 事 是 ，XML 标记 描述 的 是 文档 的 结构 和 意义 。 它 不 描述 页 面 元 
素 的 格式 化 。 可 用 样式 单 为 文档 增加 格式 化 信息 。 文 档 本 身 只 说 明文 档 包括 什么 标记 ， 而 不 是 
说 明文 档 看 起 来 是 什么 样 的 。XML 是 一 种 元 标记 语言 ， 可 用 来 设计 与 特定 专业 领域 有 关 的 标 
记 语 言 。 每 种 基于 XML 的 标记 语言 都 叫 作 XML 应 用 程序 .这 种 应 用 不 是 像 Web 浏览 器 或 XML 
Pro 那样 的 编辑 器 一 样 地 使 用 XML， 而 是 在 特定 的 领域 中 应 用 XML， 如 化 学 上 用 的 化 学 标记 
语言 Chemical Markup Language，CML)。 每 种 XML 应 用 程序 有 它 自 己 的 句法 和 词汇 表 。 这 
种 句法 和 词汇 表 遵 守 XML 的 基本 规则 。 这 有 点 像 人 类 语言 ， 每 种 语言 都 有 它们 自己 的 词汇 表 
和 语法 ， 但 同时 遵循 人 体 解 剖 学 和 大 脑 结构 所 要 求 的 基本 规则 。XML 是 以 文本 数据 为 基础 的 
非常 灵活 的 格式 。 在 本 章 中 讨论 的 广泛 的 应 用 都 选择 了 XML 作为 基础 的 原因 是 〈 排 除 大 肆 宣 
传 的 因素 )，XML 提供 了 切合 实际 的 并 清楚 地 描述 了 的 易于 读 写 的 格式 。 应 用 程序 将 这 种 格式 
用 于 它 的 数据 ， 就 能 够 将 大 量 的 处 理 细节 让 几 个 标准 工具 和 库 函 数 去 解决 。 更 进一步 说 ， 对 于 
这 样 的 程序 也 容易 将 附加 的 句法 和 语义 加 到 XML 提供 的 基本 结构 之 上 。 


12.3.2 XML 的 文件 存储 面临 的 问题 


如 果 采 用 文件 存储 XML， 那 么 会 受到 文件 系统 的 限制 ， 出 现下 面 的 问题 : 

1) 大 小 

第 一 个 局 限 是 文档 大 小 。 如 果 XML 文件 存储 了 太 多 的 数据 ， 将 变 得 非常 不 实用 。 不 仅仅 
是 因为 它 太 大 了 ， 而 且 想 维护 文档 的 不 同 部 分 也 变 得 难于 操纵 。 我 们 希望 处 理 巨 大 的 文档 ， 并 
且 想 检查 同 其 他 部 分 分 离 的 部 分 文档 。 

2) 并 发 性 

我 们 也 希望 让 不 同 的 人 在 不 同 的 时 间 更 新 不 同 的 部 分 。 在 一 个 文件 系统 中 只 有 一 个 单一 文 
档 ， 在 一 个 时 间 只 能 有 一 个 人 可 以 处 理 信息 。 
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据 的 了 


3) 工具 选择 

一 个 XML 编辑 器 可 能 不 是 处 理 一 个 文档 不 同 部 分 的 合适 工具 。 我 们 想 使 用 最 适合 处 理 数 
[ 具 维 护 文档 的 各 个 部 分 。 

4) 版 本 

一 个 经 常 考虑 的 重要 问题 是 控制 同一 文档 的 不 同 版 本 。 我 们 想 能 够 记录 一 个 文档 不 同 版 本 


的 轨迹 。 


5) 安全 
使 用 不 同 的 工具 处 理 文档 的 不 同 部 分 ， 并且 允许 不 同 的 用 户 在 同一 时 刻 处 理 文档 的 不 同 部 


分 引发 出 安全 问题 。 我 们 希望 控制 一 个 文档 的 某 一 部 分 只 有 某 人 可 以 查看 或 修改 。 


6) 综合 性 ;集中 和 重复 
我 们 希望 在 文档 中 无 颖 地 集成 其 他 的 外 部 数据 。 
文件 系统 的 局 限 限制 了 XML,， 而 数据 库 则 可 以 突破 文件 系统 的 这 些 限制 ,所 以 将 XML 与 


数据 库 相 结合 是 必要 的 。 
12.3.3 XML 与 数据 库 的 数据 转换 


使 用 XML 来 进行 数据 传输 是 很 好 的 方案 ， 因 为 数据 具有 高 度 规范 的 结构 ， 而 XML 中 的 


那些 实体 和 编码 并 不 重要 。 毕 竟 我 们 关心 的 仅仅 是 数据 而 不 在 于 这 些 数据 如 何在 文档 中 进行 物 
理 的 存储 。 如 果 应 用 程序 相对 比较 简单 ， 关 系数 据 库 和 数据 传输 中 间 件 就 可 以 满足 需求 ， 如 果 


应 用 程序 庞大 而 且 复杂 ， 那 么 就 需要 一 个 完全 支持 XML 的 开发 环境 。 
从 另 一 方面 来 说 ， 假 设 有 一 个 从 零散 的 XML 文件 创建 的 网 站 ， 不 仅 需 要 管理 这 个 网 站 ， 


还 要 提供 方法 让 用 户 可 以 查询 其 中 的 内 容 ， 这 时 网 站 的 文件 将 非常 的 不 规范 ， 而 这 些 文件 的 使 


用 却 变 得 非常 重要 ， 因 为 这 些 文件 的 结构 是 网 站 的 根本 。 
要 存储 或 检索 数据 ， 你 可 以 使 用 一 个 数据 库 〈 通 常 是 关系 型 、 面 向 对 象 型 或 者 是 层次 型 ) 


和 中 间 件 〈 自 带 或 者 是 采用 第 三 方 )， 你 也 可 以 使 用 XML 服务 器 〈 即 创建 分 布 式 应 用 的 平台 ， 
例如 利用 XML 进行 数据 传输 的 电子 商务 应 用 )。 


在 选择 数据 库 时 ， 最 重要 的 判断 因素 可 能 是 你 是 利用 数据 库 来 保存 数据 还 是 保存 文档 。 如 


果 你 想 保存 数据 ， 你 需要 的 数据 库 主要 是 面向 数据 存储 《例如 关系 型 数据 库 或 者 面向 对 象 型 数 
据 库 ) 以 及 在 数据 库 和 XML 文档 之 间 相 互 转换 。 


式 )， 


在 以 数据 为 中 心 的 文档 中 的 数据 内 容 可 能 来 自 数据 库 〈 此 时 你 想 把 数据 导出 为 XML 格 


也 可 能 是 XML 文档 (此 时 你 想 把 数据 存储 在 数据 库 中 )。 前 者 的 例子 是 在 关系 型 数据 库 


中 存储 的 大 量 现 有 数据 (或 称 遗 产 数据 )， 后 者 的 例子 是 将 数据 作为 XML 发 布 在 Web 中 ， 而 


且 你 想 要 在 你 的 数据 库 中 进行 存储 以 进行 更 多 的 处 理 。 因 此 ,根据 你 的 需求 ， 可 能 需要 将 XML 
文档 转移 到 数据 库 的 软件 ， 也 可 能 需要 从 数据 库 转移 到 XML 文档 的 软件 ， 或 者 两 者 都 支持 。 
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将 数据 存储 在 数据 库 中 时 ， 经 常 需要 丢弃 大 量 与 文档 有 关 的 信息 ， 例 如 文档 名 称 ， 同 时 还 
有 其 物理 结构 ， 例 如 实体 的 定义 和 使 用 、 属 性 值 和 同 层 元 素 的 顺序 、 二 进 制 数据 的 存储 方式 、 
字符 数据 段 和 其 他 的 编码 信息 。 类 似 地 ， 当 从 数据 库 中 检索 数据 时 ， 生 成 的 XML 文档 结果 除 
了 非 预 定义 实体 ， 不 包含 任何 字符 数据 或 实体 引用 。 而 同 层 元 素 和 属性 的 出 现 顺 序 也 常常 就 是 
从 数据 库 中 返回 的 数据 的 次 序 。 

这 一 般 是 合理 的 。 例 如 ， 假 设 你 需要 用 XML 作为 数据 格式 把 一 张 销售 从 一 个 数据 库 中 转 
移 到 另 一 个 数据 库 中 。 在 这 种 情况 下 ， 在 XML 文档 中 并 不 关心 销售 单 的 编号 是 保存 在 销售 单 
的 日 期 的 前 面 还 是 后 面 ， 也 不 用 关心 是 否 将 顾客 的 名 称 保存 在 字符 数据 段 还 是 作为 一 个 外 部 实 
体 。 最 重要 的 在 于 相关 的 数据 是 从 第 一 个 数据 库 转 移 到 第 二 个 数据 库 中 。 这 样 ， 这 个 数据 传输 
软件 就 需要 考虑 数据 的 层次 结构 〈 该 结构 将 销售 单 的 有 关 数 据 进 行 了 分 组 )， 而 其 他 则 不 必 过 
多 考虑 。 

文档 的 “ 道 反 回归 ”的 不 一 致 效应 ， 即 将 一 个 文档 的 数据 存储 在 数据 库 中 ， 然 后 根据 这 些 
数据 重新 组 织 成 新 的 文档 。 而 即便 是 根据 标准 格式 处 理 ， 得 到 的 也 常常 是 和 前 面 不 同 的 文档 。 
这 是 否 可 以 接受 要 取决 于 你 的 需求 ， 而 且 也 将 影响 到 你 对 数据 库 和 数据 传输 中 间 件 的 选择 。 

为 了 在 XML 和 数据 库 之 间 传输 数据 , 需要 在 文档 结构 和 数据 库 结构 之 间 进 行 相互 的 映射 。 
这 样 的 映射 通常 分 为 两 大 类 : 模板 驱动 和 模型 驱动 。 

在 以 模板 驱动 的 映射 中 ,没有 预先 定义 文档 结构 和 数据 库 结构 之 间 的 映射 关系 ， 而 是 使 
将 命令 语句 内 嵌入 模板 的 方法 ， 让 数据 传输 中 间 件 来 处 理 该 模板 。 例 如 ， 考 虑 下 面 的 模板 ， 在 
<SelectStmt> 元 素 中 内 嵌 了 SELECT 语句 : 


<?xml version="1.0"?> 

<FlightInfo> 

<Intro>The following flights have available seats:</Intro> 

<SelectStmt>SELECT Airline, FltNumber, Depart, Arrive FROM Flights</SelectStmt> 
<Conclude>We hope one of these meets your needs</Conclude> 

</FlightInfo> 


当 数 据 传输 中 间 件 处 理 到 该 文档 时 , 每 个 SELECT 语句 都 将 被 各 自 的 执行 结果 所 替换 ， 得 
到 下 面 的 XML 格式 : 


<?xml version="1.0"?> 

<FlightInfo> 

<Intro>The following flights have available seats:</Intro> 
<Flights> 

<Row> 

<Airline>ACME</Airline> 
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<FltNumber>123</FltNumber> 
<Depart>Dec 12, 2011 13:43</Depart> 
<Arrive>Dec 13, 2011 01:21</Arrive> 
</Row> 


</Flights> 
<Conclude>We hope one of these meets your needs</Conclude> 
</FlightInfo> 


这 种 以 模板 驱动 的 映射 可 以 相当 地 灵活 。 例 如 ， 有 些 产 品 可 以 允许 你 在 任何 结果 集合 中 替 
换 你 想 要 的 内 容 〈 包 括 在 SELECT 中 使 用 参数 )， 而 不 是 像 上 面 的 例子 中 简单 地 格式 化 结果 。 
另外 它 还 支持 使 用 编程 来 进行 构造 ， 例 如 循环 和 条 件 判断 结构 。 还 有 一 些 支持 SELECT 语句 的 
参数 化 ， 例 如 通过 HTTP 来 传递 参数 。 目 前 ， 以 模板 驱动 的 映射 只 支持 从 一 个 关系 型 数据 库 转 
换 成 XML 文档 的 情况 。 

在 以 模型 驱动 的 映射 中 ， 利 用 XML 文档 结构 对 应 的 数据 模型 将 显 式 或 隐 式 地 映射 成 数据 
库 的 结构 ， 而 且 反 之 亦 然 。 它 的 缺点 是 灵活 性 不 够 ， 但 是 却 简单 易 用 ， 这 是 因为 它 是 基于 具体 
的 数据 模型 来 进行 映射 的 ， 通 常 能 够 为 用 户 实现 很 多 的 转换 工作 。 由 于 将 数据 从 数据 库 转 换 成 
XML 的 结果 依照 了 单个 模型 ， 因 此 通常 在 这 种 方式 下 结合 XSL 来 提供 模板 驱动 的 系统 中 所 具 
有 的 灵活 性 。 在 XML 文档 中 的 数据 视图 通常 有 两 种 模型 : 表格 模型 和 特定 数据 对 象 模型 。 有 
时 候 也 可 能 会 出 现 其 他 的 模型 。 例 如 ， 通 过 采用 ID 和 IDREF 属性 ， 一 个 XML 文档 可 以 用 来 
指定 一 个 图 形 。 不 过 ， 很 多 现 有 的 中 间 件 并 不 支持 这 些 模 型 。 

(1) 表格 模型 

许多 中 间 件 软件 包 都 采用 表格 模型 在 XML 和 关系 型 数据 库 之 间 进 行 转换 。 它 把 XML 的 
模型 看 成 是 一 个 单独 的 表格 或 者 是 一 系列 的 表格 。 也 就 是 说 ，XML 的 文档 的 结构 和 下 面 的 例 
子 相 类 似 ， 其 中 在 单个 表格 的 情况 下 ，<database> 并 不 出 现 : 


<database> 

<table> 

<row> 
<column1>...</column1> 
<column2>...</column2> 


</row> 


</table> 
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</database> 


其 中 的 术语 “table” 可 理解 为 单个 的 结果 集 〈 当 从 数据 库 向 XML 中 转换 数据 时 )， 或 者 
是 一 个 单独 的 表格 或 可 更 新 的 视图 〈 当 从 XML 向 数据 库 转换 数据 时 )。 如 果 数 据 需要 来 自 多 
个 结果 集 〈 当 数据 来 自 数据 库 中 时 ) 或 者 与 仅仅 表达 成 一 系列 表格 的 集合 〈 当 转换 数据 到 数据 
库 时 ) 相 比 ，XML 的 文档 包含 有 更 深层 次 的 嵌 套 元 素 ， 那 么 类 似 的 转换 几乎 是 不 可 能 的 。 

2) 特定 数据 对 象 模型 

XML 文档 中 第 二 种 普遍 的 数据 模型 是 特定 数据 对 象 的 树 型 结构 。 在 该 模型 中 ， 元 素 类 型 
通常 对 应 对 象 ， 而 XML 中 的 内 容 模型 、 属 性 和 PCDATA 则 对 应 对 象 的 属性 。 这 种 模型 直接 映 
射 成 面向 对 象 的 数据 库 和 层次 型 数据 库 ， 当 然 借助 于 传统 的 对 象 -关系 映射 技术 和 SQL 对 象 视 
图 也 可 以 映射 成 关系 数据 库 。 要 注意 的 是 ， 这 种 模型 并 不 是 文档 对 象 模型 (DOM)。DOM 是 对 
文档 本 身 进 行 建 模 ， 而 不 是 对 文档 中 的 数据 。 

在 XML 和 数据 库 进 行 数据 转换 时 ， 需 要 考虑 许多 问题 。XML 不 支持 任何 有 实际 意义 的 数 
据 类 型 。 所 有 XML 文档 中 的 数据 都 被 当成 文本 来 对 待 ， 即 便 它 能 够 用 其 他 的 数据 类 型 〈 如 日 
期 或 者 整数 来 表示 。 通 常 ， 数 据 转换 中 间 件 将 把 XML 文档 中 的 文本 转换 成 其 他 数据 库 中 的 
数据 类 型 ， 反 之 亦 然 。 然 而 ， 特 定 的 数据 类 型 所 识别 的 文本 格式 是 有 限制 的 ， 例 如 受到 提供 的 
JDBC Driver 所 支持 的 数据 类 型 的 限制 。 在 这 些 众多 的 数据 类 型 中 ， 日 期 类 型 通常 会 导致 麻烦 。 
不 同 国际 地 区 的 数字 格式 的 差异 也 可 能 产生 问题 。 

在 数据 库 世 界 中 ， 空 值 (null) 数据 意味 着 数据 不 存在 。 但 是 这 与 一 个 值 为 0 的 数字 或 长 
度 为 0 的 字符 串 有 很 大 的 区 别 。 例 如 ， 假 设 你 的 数据 来 自 一 个 气象 站 ， 如 果 气 象 站 的 温度 计 出 
了 故障 读 不 出 温度 值 ,那么 你 的 数据 库 中 将 存储 一 个 null 值 而 不 是 一 个 0。XML 中 空 值 概念 的 
支持 可 以 通过 设置 可 选 的 元 素 类 型 或 属性 来 实现 。 如果 元 素 类 型 或 属性 值 为 null, XML 只 要 在 
文档 不 包含 该 元 素 或 者 属性 就 可 以 了 。 但 是 对 数据 库 而 言 ， 空 的 元 素 或 包含 长 度 为 零 的 字符 串 
属性 并 不 是 空 值 null， 它 们 的 值 为 长 度 为 0 的 字符 串 。 当 在 XML 文档 和 数据 库 结构 之 间 相 互 
映射 过 程 中 ， 你 必须 特别 注意 那些 可 选 的 元 素 类 型 或 属性 是 否 对 应 于 数据 库 中 的 空 值 项 。 如 果 
不 这 么 做 的 话 ， 很 可 能 出 现 插入 错误 〈 当 将 数据 转换 到 数据 库 中 时 ) 或 者 无 效 文档 错误 〈 当 将 
数据 从 数据 库 读 出 时 )。 因 为 同样 要 用 符号 表示 空 值 ，XML 中 相对 于 数据 库 而 言 更 为 灵活 。 具 
体 来 讲 ， 许 多 XML 用 户 很 可 能 包含 空 字符 串 的 空 元 素 或 属性 是 空 值 ， 这 个 时 候 你 必须 考虑 如 
何 选 择 合适 的 中 间 件 来 解决 这 个 问题 。 一 些 中 间 件 可 以 让 用 户 选 择 在 XML 文档 中 定义 用 什么 
来 组 成 空 值 。 除 了 一 些 控制 字符 ，XML 文档 能 够 包含 任何 的 Unicode 字符 。 但 许多 数据 库 都 限 
制 或 不 支持 Unicode， 而 且 需 要 一 些 特殊 的 配置 才能 够 处 理 非 ASCII 编码 的 字符 数据 。 如 果 你 
的 数据 包含 了 非 ASCII 字符 ， 那 么 务必 要 核实 你 的 数据 库 和 中 间 件 是 否 能 够 处 理 这些 字 符 。 
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12.4 面向 对 象 数据 库 


数据 库 技术 与 面向 对 象 程序 设计 方法 相 结合 形成 了 面向 对 象 数据 库 系 统 (Object Oriented 
Database System, OODBS )。 它 是 支持 将 数据 当 作 对 象 来 模拟 和 创造 的 一 种 数据 库 管 理 系统 。 通 
常 认为 ， 对 象 数据 库 必须 满足 两 项 标准 : 它 必 须 是 一 个 数据 库 管理 系统 ， 并 且 必 须 是 面向 对 象 
的 系统 ， 例 如 在 尽 可 能 的 范围 内 它 必 须 与 当前 的 面向 对 象 的 程序 语言 相 兼 容 。 第 一 个 标准 转换 
为 五 个 特征 : 持续 性 、 二 级 存储 管理 、 同 步 性 、 防 御 性 和 一 个 特定 询问 工具 。 第 二 个 标准 转换 
为 八 个 特性 : 复杂 的 对 象 、 对 象 一 臻 性、 封装 、 类 型 、 继 承 性 、 迟 约束 、 可 延长 性 和 计算 的 完 
全 性 。 

传统 的 层次 、 网 状 和 关系 数据 库 系统 在 许多 传统 的 商业 数据 库 应 用 中 取得 了 极 大 的 成 功 ， 
然而 在 设计 和 实现 更 为 复杂 的 数据 库 应 用 时 ， 传 统 数据 库 系 统 就 暴露 了 一 些 缺 陷 。 在 设计 与 实 
现 工程 设计 和 制造 数据 库 、 科 学 实验 数据 库 、 电 信 数 据 库 、 地 理 信息 系统 数据 库 以 及 多 媒体 数 
据 库 的 时 候 , 新 的 应 用 要 求 被 提出 了 。 如 长 事务 的 处 理 , 图 像 或 大 文本 项 等 新 数据 类 型 的 存储 ， 
以 及 非 标准 的 特殊 应 用 操作 ， 传 统 的 数据 库 系统 往往 不 能 满足 这 些 复杂 数据 库 应 用 的 要 求 。 
面向 对 象 程序 设计 方法 已 经 被 广泛 地 应 用 于 软件 工程 、 知 识 库 、 人 工 智 能 和 计算 机 系统 等 
领域 。 面 向 对 象 程序 设计 方法 和 数据 库 技术 的 结合 ， 不 但 能 让 设计 者 定义 复杂 对 象 的 结构 ， 还 
能 让 设计 者 定义 作用 于 这 些 复杂 对 象 的 操作 ， 从 而 能 够 有 效 地 支持 新 一 代 的 数据 库 应 用 。 

1990 年 7 月 , 美国 高 级 DBMS 功能 委员 会 发 表 了 “第 三 代数 据 库 系 统 宣言 ”， 提 出 指导 
发 第 三 代数 据 库 系 统 的 3 条 基本 原则 。 

(1) 第 三 代数 据 库 系 统 必 须 支持 数据 管理 、 对 象 管理 和 知识 管理 。 

(2) 第 三 代数 据 库 系统 必须 保持 或 继承 第 二 代数 据 库 系统 的 技术 。 

(3) 第 三 代数 据 库 系 统 必 须 对 其 他 系统 开放 。 

从 这 次 宣言 中 可 知 ， 第 三 代数 据 库 必须 支持 面向 对 象 模型 。 面 向 对 象 数 据 库 系统 正 是 以 面 
向 对 象 模型 为 基础 的 ， 它 必 将 成 为 数据 库 技术 发 展 的 一 大 趋势 。 
面向 对 象 数据 库 产 品 的 研制 和 开发 上 存在 着 两 大 派别 ， 即 : 对 象 关系 数据 库 和 纯粹 的 面向 
对 象 数据 库 。 前 者 认为 关系 数据 库 具 有 坚实 而 成 熟 的 理论 基础 ， 主 张 对 现 有 的 关系 数据 库 系 统 
进行 扩充 和 改进 , 使 之 升级 为 对 象 关系 数据 库 系 统 。 具 有 代表 性 的 对 象 关系 数据 库 系 统 产品 有 : 
DB2、ORACLE、SQL SERVER 等 。 纯 粹 的 面向 对 象 数据 库 派 则 主张 进行 彻底 的 数据 库 革命 ， 
即 采用 全 新 的 数据 模型 和 模式 ， 抛 开 现 有 的 数据 库 系 统 ， 从 底层 做 起 ， 使 之 成 为 真正 的 、 纯 粹 
的 面向 对 象 数据 库 系 统 。 其 代表 性 的 产品 有 ObjectStore、db4o、Versant Object Database、 及 IRIS 
等 。 无 论 是 对 象 关 系数 据 库 还 是 纯粹 的 面向 对 象 数据 库 ， 面 向 对 象 的 概念 和 方法 是 其 不 可 缺少 
的 组 成 部 分 。 究 竟 哪 一 个 更 适合 于 存储 和 访问 复杂 的 数据 ， 具 有 更 优越 性 的 性 能 ， 在 理论 界 和 
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工业 界 还 有 争论 ， 有 待 于 在 实际 应 用 中 加 以 比较 和 校 验 。 


对 象 数 据 库 有 以 下 几 大 优势 。 
(1) 更 快 的 开发 速度 ， 直 接 使 用 程序 开发 语言 实现 ， 不 需要 再 编写 烦琐 的 操作 SQL 的 语 


句 ， 大 大 节约 了 开发 成 本 。 


〈2) 更 快 的 运行 速度 ， 采 用 导航 式 的 搜索 模式 ， 可 以 更 高 效 地 获取 数据 。 对 象 数 据 库 保 


持 着 世界 上 最 大 的 数据 库 和 被 记录 到 的 最 高 摄取 率 。 


〈3) 强大 的 数据 管理 支持 能 力 ， 适 用 于 复杂 数据 的 管理 。 
(4) 支持 分 布 式 数据 节点 管理 ， 适 用 于 建立 统一 的 大 型 数据 环境 。 
在 这 里 我 们 主要 对 db4o 进行 一 下 简单 的 介绍 。db4o 是 一 个 开源 的 纯 面 向 对 象 的 数据 库 引 


擎 ， 对 于 Java 与 .NET 开发 者 来 说 都 是 一 个 简单 易 用 的 对 象 持久 化 工具 。 同 时 ，db4o 已 经 被 第 
三 方 验证 为 具有 优秀 性 能 的 面向 对 象 数据 库 。db4o 的 一 个 突出 的 优点 是 无 须 DBA 的 管理 ， 占 
用 资源 很 小 ， 很 适合 嵌入 式 应 用 以 及 Cache 应 用 。 所 以 自从 db4o 发 布 以 来 便 迅速 吸引 了 大 批 
用 户 将 db4o 用 于 各 种 各 样 的 嵌入 式 系统 ， 包 括 流动 软件 、 医 疗 设备 和 实时 控制 系统 。 


人 


db4o 的 目标 是 提供 一 个 功能 强大 的 ， 适 合 嵌 入 的 数据 库 引擎 ， 其 主要 特性 如 下 。 
(1) 开源 模式 

(2) 原生 数据 库 

(3) 高 性 能 

(4) 易 嵌 入 

(5) 零 管理 

(6) 支持 多 种 平台 


2.4.1 面向 对 象 数据 库 系统 的 特征 
数据 库 的 特征 依赖 于 实际 应 用 ， 所 设计 的 数据 库 语言 必须 允许 用 户 方便 地 使 用 这 些 特征 ， 


数据 库 的 结构 也 应 能 有 效 地 支持 这 些 特征 。 本 节 结 合 面向 对 象 的 程序 设计 方法 ， 讨 论 面向 对 象 


数据 库 系统 与 传统 数据 库 系 统 相 区 别 的 主要 特征 。 


(1) 面向 对 象 数据 库 系统 应 该 具有 表达 和 管理 对 象 的 能 力 。 面 向 对 象 数据 库 系 统 通过 对 象 


及 它们 之 间 的 相互 联系 来 描述 现实 世界 。 它 应 该 支持 对 象 标识 ， 使 得 对 象 的 存在 不 依赖 于 本 身 
的 值 ， 而 只 依赖 于 它 的 标识 ， 对 象 间 能 够 通过 对 象 标识 而 相互 区 分 。 类 的 层次 和 继承 是 一 个 关 


键 的 概念 , 新 的 类 允许 从 以 前 定义 过 的 类 那里 继承 结构 和 操作 。 因此 在 面向 对 象 数据 库 系统 中 ， 


HH 


象 间 的 联系 。 在 ODMG2.0 (Object Database Management Group， 对 象 数据 库 管理 组 ) 标准 中 ， 
提出 了 用 一 对 反 向 引用 来 表示 二 元 关系 ， 即 ， 把 与 某 个 对 象 相关 的 对 象 的 标识 放 在 那个 对 象 内 
部 ， 并 维护 参照 完整 性 。 


折 的 对 象 类 型 可 以 简便 地 重用 已 有 的 类 型 定义 。 面 向 对 象 数据 库 系统 的 一 个 问题 是 如 何 表示 对 
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(2) 


面向 对 象 数据 库 系统 中 的 对 象 可 以 具有 任意 复杂 度 的 对 和 象 结构 。 这 使 对 象 能 够 包含 所 


有 描述 该 对 象 的 必要 信息 。 传 统 数据 库 恰好 与 此 相反 ， 它 把 关于 复杂 对 象 的 信息 分 散在 许多 关 
系 或 记录 中 ， 从 而 丧失 了 现实 世界 的 对 象 与 数据 库 表 示 之 间 的 直接 对 应 关系 。 在 面向 对 象 数据 


库 系 统 中 ， 
在 某 一 时 刻 将 一 成 员 对 象 加 进去 。 


的 对 


向 


过 


(3) 


允许 逐步 细 化 复杂 实体 ， 还 能 将 整个 复杂 对 象 或 其 子 集 作为 一 个 独立 的 单位 ， 可 以 


而 向 对 象 数据 库 系统 必须 具有 与 面向 对 象 编程 语言 交互 的 接口 。 面 向 对 象 程序 设计 中 


j 象 是 瞬 态 对 象 ， 只 在 程序 执行 过 程 中 存在 ， 而 面向 对 象 数据 库 可 以 延长 对 象 的 存在 ， 把 对 
象 持久 地 存储 起 来 。 对 象 在 程序 结束 之 后 仍然 持续 存在 ， 以 后 可 以 被 检索 或 被 其 他 程序 使 用 。 
对 象 数据 库 系 统 通过 与 面向 对 象 编 程 语言 交互 的 接口 ， 可 以 提供 持久 化 对 象 和 共享 对 象 的 


能 力 ， 从 而 允许 多 个 程序 和 应 用 共享 这 些 对 和 象 。 


(4) 面向 对 象 数据 库 应 具有 表达 和 管理 数据 库 变 化 的 能 力 。 管 理 同一 对 象 的 多 个 版 本 的 能 


力 对 于 设计 和 工程 应 用 是 至 关 重 要 的 。 一 个 对 象 的 旧版 本 代表 一 个 已 经 通过 测试 和 鉴定 的 设计 


方案 ， 那 么 应 该 保存 这 个 版 本 直到 新 版 本 通过 测试 和 鉴定 。 除 了 允许 版 本 变化 外 ， 面 向 对 象 数 
据 库 系 统 也 应 该 允许 模式 演变 。 所 谓 模式 演变 ， 是 指 类 的 声明 发 生 了 变化 ， 或 创建 了 新 的 类 或 
联系 。 
综 上 所 述 ， 一 个 面向 对 象 数据 库 系统 首先 应 是 一 个 数据 库 系 统 ， 同 时 又 必须 具有 面向 对 象 
的 特征 。 


12.4.2 面向 对 象 数 据 模 型 


数据 模型 是 现实 世界 对 象 或 实体 ， 以 及 对 象 的 约束 和 对 象 间 联 系 的 逻辑 组 织 。 面 向 对 象 数 
据 模型 借鉴 了 面向 对 象 的 概念 ， 是 面向 对 象 数据 库 系统 所 必须 支持 的 数据 模型 。 


势 。 


面向 对 象 数据 库 系统 是 以 面向 对 象 数据 模型 为 基础 的 ， 是 当今 数据 库 技术 发 展 的 一 大 趋 
对 于 
的 定义 。 面 向 对 象 数据 模型 可 以 看 作 是 一 个 更 高 层次 上 的 实现 数据 模型 的 新 成 员 ， 它 经 常 被 用 


面向 对 象 数据 模 型 ， 已 经 有 许多 基本 概念 达成 了 共识 ， 但 是 仍然 缺少 一 个 统一 的 严格 


作 高 层 概念 模型 ， 尤 其 在 软件 工程 领域 中 更 是 如 此 。 
一 系列 面向 对 象 的 概念 构成 了 面向 对 象 数据 模型 的 基础 。 概 括 起 来 ， 面 向 对 象 数据 模型 的 
基本 概念 有 对 象 、 类 、 继 承 、 对 象 标识 、 对 象 嵌 套 等 ， 下 面 将 一 一 加 以 介绍 。 


不 可 


1. 


对 象 结构 


我 们 可 以 认为 一 个 对 象 对 应 着 E-R 模型 中 的 一 个 实体 。 对 象 中 封装 的 属性 和 方法 对 外 界 是 
[ 见 的 ， 对 象 之 间 的 相互 作用 要 通过 消息 来 实现 。 一 般 来 讲 ， 一 个 对 象 有 如 下 相关 内 容 。 


(1) 


属性 


属性 集合 : 一 个 对 象 的 属性 值 构成 了 该 对 象 的 状态 ， 类 似 于 关系 数据 库 中 关系 元 组 的 


E。 属 性 的 值 域 可 以 是 任何 类 ， 包 括 原子 类 ， 如 整 型 值 、 字 符 串 等 。 一 个 属性 可 以 有 一 个 单 
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一 值 ， 也 可 以 有 一 个 来 自 于 某 个 值 域 的 值 集 ， 即 一 个 对 象 的 属性 可 以 是 一 个 对 象 ， 从 而 形成 了 
嵌 套 关系 。 

(2) 方法 集合 : 一 个 对 象 的 方法 作用 于 该 对 象 的 状态 上 , 同一 类 对 象 所 有 操作 的 实现 相同 。 
方法 的 定义 和 实现 : 定义 规定 了 方法 名 称 、 参 数 的 个 数 和 类 型 、 返 回 值 的 类 型 ， 以 及 可 能 的 语 
义 描述 ， 实 现 是 一 段 代 码 ， 用 来 实现 方法 的 功能 。 方 法 的 定义 和 实现 是 相互 分 离 的 ， 为 程序 员 
提供 了 极 大 的 灵活 性 ， 甚 至 可 以 用 不 同 的 语言 实现 不 同 的 操作 。 

(3) 消息 集合 : 消息 是 发 送 给 对 象 以 存 取 属 性 值 的 ， 除 了 通过 对 象 所 指定 的 公共 界面 外 ， 
没有 其 他 方法 可 以 访问 该 对 象 。 对 象 接收 外 部 传送 的 消息 ， 执 行 相应 的 操作 ， 操 作 的 结果 同样 
可 以 以 消息 的 形式 返回 。 

2. 对 象 类 


在 面向 对 象 数据 库 中 ， 类 是 一 系列 相似 对 象 的 集合 ， 对 应 于 E-R 模型 中 的 实体 集 概念 。 类 
是 面向 对 象 系统 和 数据 库 系 统 之 间 最 重要 的 连接 。 首 先 ， 类 直接 说 明了 一 个 实例 及 其 所 属 类 之 
间 的 实例 关系 ; 其 次 ， 类 提供 了 构成 查询 的 基础 ， 还 有 ， 类 可 以 用 来 增加 面向 对 象 数 据 库 的 语 
义 完整 性 ;最 后 ， 类 提出 了 所 有 对 象 的 属性 和 方法 的 规格 说 明 ， 便 于 生成 对 象 。 

每 个 对 象 是 它 所 在 类 的 一 个 实例 。 类 的 概念 类 似 于 关系 模式 ， 类 的 属性 类 似 于 关系 模式 中 
的 属性 ， 对 象 类 似 于 元 组 ， 类 的 一 个 实例 对 象 类 似 于 关系 中 的 一 个 元 组 。 如 果 把 类 本 身 看 作 一 
个 对 象 , 则 称 之 为 类 对 象 。 与 其 相关 的 属性 集 和 方法 集 适 用 于 该 类 对 象 而 不 适用 于 该 类 的 实例 ， 
这 样 的 属性 和 方法 称 之 为 类 属性 和 类 方法 。 一 个 类 的 类 属性 常常 用 来 描述 该 类 的 实例 的 聚集 特 
性 。 例 如 ， 所 有 学 生 实例 的 “平均 年 龄 ”就 是 一 个 聚集 特性 的 例子 。 


3. 继承 与 多 重 继承 


在 面向 对 象 数据 模型 中 ， 所 有 类 形成 了 一 个 有 限 的 层次 结构 或 者 是 有 根 的 无 环 有 向 图 ， 我 
们 称 之 为 类 层次 。 如 有 一 个 类 C 和 一 个 连接 到 C 的 一 组 较 低 层 类 的 集合 S， 则 集合 S 中 的 类 称 
为 类 C 的 子 类 ， 而 类 C 又 称 为 集合 S 中 类 的 父 类 。 集 合 S 中 的 任何 类 继承 类 C 的 所 有 属性 和 
方法 ， 并 可 以 有 自己 定义 的 属性 和 方法 。 一 个 父 类 可 以 有 多 个 子 类 ， 一 个 子 类 也 可 以 有 多 个 父 
类 ， 都 存在 直接 关联 或 者 间接 关联 的 现象 。 

在 面向 对 象 数 据 模型 中 存在 着 两 种 继承 : 继承 〈 单 继承 ) 和 多 重 继承 。 在 大 多 数 情况 下 ， 
类 的 继承 足以 满足 应 用 的 要 求 ， 典 型 的 树 型 结构 组 织 用 来 表示 类 层次 。 在 树 型 结构 组 织 中 ， 每 
个 类 最 多 有 一 个 父 类 ， 即 一 个 子 类 只 能 继承 一 个 父 类 的 属性 、 方 法 和 消息 。 然 而 ， 有 些 情况 
树 型 结构 并 不 能 很 好 地 表达 类 层次 。 多 重 继承 允许 一 个 类 从 多 个 直接 父 类 中 继承 属性 、 方 法 和 
消息 ， 此 时 类 层次 可 以 用 一 个 有 向 无 环 图 来 表示 。 
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在 图 12-10 中 给 出 了 一 个 学 校 数据 库 的 类 层次 结构 图 ， 通 过 它 我 们 分 别 来 解释 类 层次 、 继 
承 和 多 重 继承 。 


教师 行政 人 员 | 工人 在 职 研究 生 研究 生 本 科 生 


12-10 具有 多 继承 的 类 层次 结构 图 


在 这 个 学 校 应 用 的 面向 对 象 数据 库 系统 中 ,“ 人 ”是 其 他 所 有 类 的 父 类 ， 它 是 这 个 有 向 无 环 

图 的 根 ， 是 一 个 最 高 的 类 层次 ， 在 下 面 的 一 个 类 层次 中 ， 教 工 和 学 生 是 人 的 子 类 ， 它 们 继承 了 
人 的 所 有 属性 、 方 法 和 消息 ,同时 又 有 本 身 的 特殊 属性 、 方 法 和 消息 ; 在 最 低 的 一 个 类 层次 中 ， 
教师 、 行 政 人 员 、 工 人 和 在 职 研究 生 是 教工 的 子 类 ， 它 们 继承 了 教工 和 人 的 所 有 属性 、 方 法 和 
消息 。 在 职 研究 生 、 研 究 生 和 本 科 生 是 学 生 的 子 类 ， 它 们 继承 了 学 生 和 人 的 所 有 属性 、 方 法 和 
消息 。 值 得 一 提 的 是 ， 在 职 研究 生 既 是 教工 的 子 类 ， 也 是 学 生 的 子 类 ， 它 同时 继承 了 教工 和 学 
生 两 个 父 类 的 所 有 属性 、 方 法 和 消息 。 
类 的 继承 带 来 很 多 的 优点 ， 子 类 在 继承 父 类 特性 的 同时 ， 还 可 以 定义 自身 的 属性 、 方 法 和 
消息 ， 但 这 样 就 可 能 和 父 类 的 属性 、 方 法 和 消息 发 生 冲突 。 这 类 冲突 可 能 发 生 在 子 类 和 父 类 之 
间 ， 通 常 由 系统 解决 。 对 于 子 类 和 父 类 之 间 的 同名 冲突 ， 一 般 是 以 子 类 的 定义 为 准 。 但 是 在 多 
继承 中 ， 一 个 子 类 可 以 有 多 个 父 类 ， 如 果 这 些 父 类 中 存在 同名 冲突 ， 就 会 发 生 二 义 性 。 例 如 
教工 和 学 生 都 有 方法 “显示 信息 ” 它们 共同 的 子 类 在 职 研究 生 就 不 知道 应 该 继承 哪 一 个 方法 
了 。 在 多 继承 中 有 三 种 处 理 二 义 性 的 方案 : 一 是 由 用 户 选 择 继承 的 优先 次 序 ， 二 是 由 系统 指定 
继承 某 一 个 父 类 的 定义 ;三 是 如 果 出 现 了 二 义 性 问题 ， 就 不 允许 多 继承 ， 甚 至 有 些 面 向 对 象 数 
据 库 系 统 根本 不 允许 多 继承 。 


4， 对 象 标识 
每 个 对 象 有 一 个 唯一 的 、 由 系统 生成 的 对 象 标识 〈Object Identifier，OID )。OID 的 值 对 外 


户 来 说 是 不 可 见 的 ， 但 是 系统 会 在 内 部 用 这 个 值 唯一 地 标识 每 个 对 象 ， 并 用 这 个 值 创 建 和 
内 部 对 象 引用 。 


ea 


厅 淮 
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相对 于 非 面向 对 象 数据 模型 和 程序 设计 语言 来 说 ， 对 象 标识 给 出 了 一 种 更 强 的 标识 概念 ， 
几 种 常用 的 标识 形式 如 下 。 

(1) 值 : 用 于 标识 的 一 个 数据 值 。 这 种 形式 的 标识 常 在 关系 数据 库 中 使 用 。 如 一 个 元 组 的 
主 码 标识 了 这 个 元 组 。 

(2) 名 称 : 用 于 标识 的 用 户 提供 的 一 个 名 称 。 在 程序 设计 语言 中 ， 用 户 赋予 每 个 变量 一 个 名 
字 来 标识 它 ， 在 文件 系统 中 ， 用 户 给 每 个 文件 赋予 一 个 名 称 来 唯一 地 标识 这 个 文件 。 

(3) 内 置 名 : 以 上 两 种 标识 是 由 用 户 给 出 的 ， 而 内 置 名 则 是 一 种 由 系统 来 提供 的 标识 。 这 
种 形式 的 标识 在 数据 模型 或 程序 设计 语言 中 使 用 。 

不 同 的 标识 符 其 持久 性 程度 是 不 同 的 ， 主 要 有 以 下 几 种 。 

(1) 过 程 内 持久 性 : 标识 只 有 在 单个 过 程 的 执行 期 间 才 是 持久 的 ， 如 过 程 内 的 局 部 变量 。 

(2) 程序 内 持久 性 : 标识 只 有 在 单个 程序 或 查询 执行 期 间 才 是 持久 的 ， 如 程序 设计 语言 
的 全 局 变量 、 内 存 指针 ，SQL 语句 中 的 元 组 标识 符 。 

(3) 程序 间 持 久 性 : 标识 在 从 一 个 程序 的 执行 到 另 一 个 程序 的 执行 期 间 都 保持 不 变 ， 如 指 
向 磁盘 上 的 文件 系统 数据 的 指针 提供 了 程序 之 间 的 标识 ，SQL 语句 中 的 关系 名 也 具有 程序 间 持 
久 性 。 

(4) 永久 持久 性 : 标识 的 持久 性 不 仅仅 跨越 了 各 个 程序 的 执行 ， 还 跨越 了 数据 结构 的 重新 
组 织 。 这 种 持久 性 正 是 面向 对 象 系统 所 要 求 的 。 

对 象 标识 符 必 须 具 有 永久 持久 性 ， 也 就 是 说 ， 特 定 对 象 一 经 产生 ， 系 统 就 赋予 一 个 在 全 系 
统 中 唯一 的 对 象 标 识 符 ， 应 该 是 固定 不 变 的 ， 一 直到 它 被 删除 。 面 向 对 象 数据 库 系统 必须 具有 
生成 对 象 标识 并 维护 其 永远 不 变性 的 机 制 。 

标识 符 通常 是 由 系统 自动 生成 的 ， 不 需要 用 户 来 完成 这 项 工作 。 然 而 在 使 用 这 种 功能 时 要 
注意 : 系统 生成 的 标识 符 通常 是 特定 于 这 个 系统 的 ， 如 果 要 将 数据 转移 到 另 一 个 不 同 的 数据 库 
系统 中 ， 则 标识 符 必须 进行 转化 。 而 且 ， 如 果 一 个 实体 在 建 模 时 已 经 有 一 个 系统 之 外 的 唯一 标 
识 符 ， 则 系统 生成 的 标识 符 就 可 能 是 多 余 的 。 如 身份 证 号 码 可 以 作为 个 人 的 唯一 标识 符 。 

早期 的 面向 对 象 数据 模型 要 求 把 所 有 的 一 切 表示 为 对 象 ， 无 论 是 一 个 简单 的 值 还 是 一 个 复 
杂 的 对 象 ， 导致 这 样 的 情况 出 现 : 两 个 整 型 数值 10 和 20, 需要 创建 两 个 具有 不 同 OID 的 对 象 。 
这 种 模型 需要 生成 很 多 的 对 象 标 识 符 ， 很 不 实用 。 因 此 ， 大 多 数 的 面向 对 象 数据 库 系统 允许 有 
对 象 和 值 两 种 表示 方法 ， 即 每 个 对 象 必须 有 一 个 永远 不 变 的 OID， 但 是 值 没有 OID， 值 只 是 代 
表 它 自己 。 


5， 对象 嵌 套 


对 象 嵌 套 是 面向 对 象 数 据 库 系统 中 的 一 个 重要 概念 。 
在 面向 对 象 数据 模型 中 ， 对 象 的 一 个 属性 可 以 是 一 个 单一 值 ， 也 可 以 是 一 个 来 自 于 值 域 的 值 


三 
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， 即 一 个 对 象 的 属性 可 以 是 一 个 对 象 ， 形 成 了 媒 套 关系 ， 产 生 了 一 个 嵌 套 层次 结构 。 

一 个 对 象 被 称 之 为 复杂 对 象 ， 如 果 它 的 某 个 属性 的 值 是 另 一 个 对 象 。 复 杂 对 象 主要 分 为 两 
: 非 结构 化 的 复杂 对 象 和 结构 化 的 复杂 对 象 。 非 结构 化 的 复杂 对 象 通常 是 数据 库 系 统 不 明 结 
、 需 要 大 量 存储 空间 的 数据 类 型 ， 如 图 像 或 大 文本 对 象 。 结 构 化 的 复杂 对 象 是 指数 据 库 系 统 
楚 对 象 内 部 结构 ， 并 可 以 通过 递归 生成 的 对 象 。 


关系 模式 是 对 一 个 二 维 关系 的 描述 ， 具 有 平面 的 结构 。 前 面 讲 到 的 类 层次 结构 形成 了 对 和 象 
间 的 纵向 关系 ， 这 里 的 对 象 嵌 套 层次 结构 则 形成 了 对 象 间 的 横向 关系 。 我 们 通过 图 12-11 来 说 


明 。 每 台 笔记 本 


电脑 包括 : 产地 、 型 号 、 外 部 设备 和 内 部 器 件 等 属性 。 其 中 产地 和 型 号 的 数据 


类 型 是 字符 串 ， 外 部 设备 和 内 部 器 件 都 不 是 标准 数据 类 型 ， 而 是 对 象 。 外 部 设备 包括 : 外 接 鼠 
标 和 外 接 光 驱 等 属性 ， 内 部 器 件 包括 : 显示 器 、CPU、 内 存 、 硬 盘 等 属性 ， 外 接 光 驱 也 是 一 个 
对 象 ， 包 括 : 产地 、 型 号 、 功 率 等 属性 。 这 样 一 种 霸 套 层次 结构 允许 不 同 的 用 户 采 用 不 同 的 粒 


度 来 观察 对 象 ， 突 


了 对 象 的 特征 ， 隐 藏 了 不 必要 的 信息 ， 简 化 了 查询 。 


笔记 本 电脑 


| 


产地 、 型 号 、 外 部 设备 、 内 部 器 件 


pa 一 
外 接 鼠 标 、 外 接 光 驱 显示 器 、CPU、 内 存 、 硬 盘 
产地 、 型 号 、 功 率 


图 12-11 笔记 本 电脑 的 风 套 层次 图 


12.4.3 面向 对 象 数据 库 语言 


面向 对 象 数 据 库 语 言 用 于 描述 面向 对 象 数据 库 的 模式 ， 说 明 并 操纵 类 定义 与 对 象 实例 。 与 


关系 数据 库 的 标准 语言 SQL 类 似 ， 面 向 对 象 数据 库 语言 主要 包括 对 象 定义 语言 和 对 象 操纵 语 
言 。 对 象 查询 语言 是 对 象 操 纵 语言 的 一 个 重要 子 集 。 


撤销 类 。 其 


(2) 操 


面向 对 象 数据 库 语言 一 般 应 具备 下 列 功能 。 

(1) 类 的 定义 和 操纵 。 面 向 对 和 象 数据 库 语 言 可 以 操纵 类 ， 包 括 定 义 、9 
类 的 定义 包括 定义 类 的 属性 、 操 作 特 征 、 继 承 性 与 约束 等 。 
/方法 的 定义 。 面 向 对 象 数据 库 语言 可 用 于 对 象 操作 /方法 的 定义 与 实现 。 在 操作 


实现 中 , 语言 的 命令 可 用 于 操作 对 象 的 局 部 数据 结构 。 对 象 模型 中 的 封装 性 允许 操作 /方法 


成 、 存 取 、 修 改 与 


不 
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同 程序 设计 语言 来 实现 ， 并 且 隐 藏 不 同 程序 设计 语言 实现 的 事实 。 

(3) 对 和 象 的 操纵 。 面 向 对 象 数据 库 语言 可 以 用 于 操纵 实例 对 象 。 

对 象 数 据 库 管理 组 织 (Object Database Management Group，ODMG) 是 面向 对 象 数据 库 管 
理 系统 软件 商 的 国际 联盟 , 曾经 提出 一 种 标准 , 即 ODMG1.0。 该 标准 目前 已 经 修订 到 ODMG3.0。 
ODMG 对 象 模型 提供 了 数据 类 型 、 类 型 构造 器 ， 以 及 其 他 一 些 可 以 用 于 对 象 定义 语言 来 说 明 对 
象 数据 库 模 式 的 概念 ， 它 是 对 象 定义 语言 和 对 象 查询 语言 的 基础 。 

对 象 定义 语言 被 设计 成 为 支持 ODMG 对 象 模型 的 语义 结构 ， 并 且 独 立 于 任何 特定 的 编程 

言 。 它 的 主要 用 途 是 创建 对 象 说 明 ， 也 就 是 类 和 接口 。 因 此 对 象 定义 语言 不 是 一 个 完全 的 编 

程 语言 。 用 户 可 以 独立 于 任何 编程 语言 在 对 象 定义 语言 中 指定 一 种 数据 库 模 式 ， 然 后 使 用 特定 
的 语言 绑 定 来 指明 如 何 将 对 象 定义 语言 结构 映射 到 特定 编程 语言 的 结构 ， 如 C++、 
SMALLTALK、JAVA。 

对 象 查询 语言 是 专门 为 ODMG 对 象 模型 指定 的 查询 语言 。 对 象 查询 语言 被 设计 为 与 编程 
语言 紧密 配合 使 用 ， 这 些 编程 语言 有 一 个 ODMG 绑 定 的 定义 ， 如 CH+、SMALLIALK、JAVA。 
这 样 幅 入 某 种 编程 语言 的 一 个 对 象 查 询 语言 的 查询 ， 可 以 返回 与 那 种 语言 的 类 型 系统 相 匹 配 的 
对 象 。 对 于 查询 ,对 象 查询 语言 语法 和 关系 型 标准 查询 语言 SQL 的 语法 相似 , 只 是 增加 了 有 关 
对 象 的 特征 ， 如 对 象 标识 、 复 杂 对 象 、 操 作 、 继 承 、 多 态 性 。 
向 对 象 数 据 库 语 言 是 面向 对 象 数 据 库 与 传统 数据 库 相 区 别 的 一 个 重要 特征 。 但 是 面向 对 
象 数据 库 语言 的 查询 功能 很 弱 ， 这 是 因为 用 变量 引用 对 象 的 方式 不 能 对 对 象 进行 统一 管理 。 例 
如 图 书 作为 类 ， 作 者 是 属性 。 面 向 对 象 数据 库 语言 可 从 每 一 书 的 对 象 找到 它 的 所 有 作者 ， 但 不 
支持 另 一 方向 的 查询 ， 即 从 作者 查询 他 的 所 有 作品 ， 除 非 把 作者 也 定义 成 一 个 类 同时 把 作品 设 
置 成 属性 ， 这 样 的 设计 将 在 数据 库 中 造成 见 余 ， 为 此 就 有 必要 扩充 面向 对 象 数据 库 语言 的 查询 
功能 。 

数据 库 系统 从 网 状 模型 到 关系 模型 的 进步 使 数据 库 查询 语言 从 用 户 导 航 式 的 过 程 性 语言 
进入 到 了 由 系统 自动 选择 查询 路 径 的 非 过 程 性 语言 。 但 是 非 过 程 性 语言 的 面向 集合 的 操作 方式 
又 与 高 级 程序 设计 语言 的 面向 单个 数据 的 操作 方式 之 间 产 生 了 不 协调 现象 ， 俗 称 阻抗 失 配 。 阻 
抗 失 配 的 根本 原因 在 于 关系 数据 库 的 数据 模型 和 程序 设计 语言 不 一 致 。 因 而 ， 对 媒 入 式 数据 库 
语言 来 说 不 可 避免 地 产生 阻抗 失 配 。 但 面向 对 象 数据 库 不 同 ， 它 的 数据 模型 的 概念 来 自 面向 对 
象 的 程序 设计 方法 ， 因 此 作为 某 一 面向 对 象 的 程序 设计 语言 扩充 的 面向 对 象 数据 库 语言 ， 能 够 
从 根本 上 解决 阻抗 失 配 问题 。 

商业 的 关系 型 数据 库 管理 系统 成 功 的 一 个 原因 在 于 SQL 标准 。 对 象 数据 库 管理 组 织 曾经 提 
出 ODMG1.0 标准 ， 已 经 修订 为 ODMG3.0， 它 包含 了 对 象 定义 语言 和 对 象 操纵 语言 。 但 是 目前 
还 没有 一 个 关于 面向 对 象 数据 语言 的 标准 能 够 像 SQL 标准 那样 得 到 业界 的 普遍 支持 , 现今 不 同 
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的 面向 对 象 数据 库 管理 系统 的 数据 库 语 言 各 不 相同 ， 要 解决 这 个 问题 还 要 花 很 长 的 时 间 。 
12.4.4 对象 关 系数 据 库 系 统 


在 今天 的 商业 领域 中 ， 有 许多 可 用 的 数据 库 管理 系统 产品 ， 占 统治 地 位 的 主要 有 两 个 : 关 
系数 据 库 系统 和 面向 对 象 数 据 库 系 统 ， 分 别 支 持 关系 数据 模型 和 对 象 数据 模型 。 数 据 库 管理 系 
统 产品 的 另外 两 种 主要 类 型 是 : 层次 数据 库 和 网 状 数据 库 , 它们 分 别 基于 层次 和 网 状 数据 模型 。 
随 着 数据 库 技术 的 发 展 ， 后 两 种 数据 库 系统 会 逐渐 被 前 两 种 所 取代 。 

数据 库 系统 面临 着 许多 领域 的 新 的 应 用 挑战 ， 如 音频 和 视频 处 理 系 统 中 的 数字 化 信息 ， 计 
算 机 辅助 桌面 排版 系统 中 的 大 文本 ， 人 造 卫 星 成 像 或 天 气 预报 中 的 图 像 ， 工 程 设 计 、 生 物 基 
组 信息 、 建 筑 图 中 的 复杂 数据 ;股票 市 场 交易 历史 或 卖 出 历史 中 的 时 间 序 列 数据 ;地 图 数据 和 
业务 数据 中 的 空间 和 地 理 数据 。 显 然 需要 设计 某 些 数据 库 ， 它 们 可 以 开发 、 操 纵 和 维护 来 自 这 
些 应 用 的 复杂 对 和 象 。 
在 面 对 上 述 复杂 应 用 时 ， 基 本 关系 模型 及 其 SQL 语言 的 早期 版 本 被 证 明 是 不 适用 的 。 层 次 
数据 模型 可 以 很 好 地 适用 于 在 组 织 中 自然 存在 的 分 层 结构 , 但 是 它 在 数据 中 的 内 置 层次 路 径 上 过 
于 局 限 和 固定 。 网 状 数 据 模型 可 以 明确 地 对 联系 建 模 ， 但 是 在 实现 方面 却 需要 使 用 大 量 的 指针 ， 
而 且 不 具备 对 象 标 识 、 继 承 、 封 装 这 类 概念 ， 也 不 支持 多 种 数据 类 型 和 复杂 对 象 。 因 此 产生 了 一 
种 趋势 ， 即 将 对 象 数据 模型 中 的 特征 和 语言 结合 到 关系 数据 模型 中 ， 这 样 扩展 了 关系 数据 模型 ， 
形成 了 对 象 关系 数据 库 系统 ， 使 它 能 够 处 理 当今 复杂 的 应 用 。 

对 象 关系 数据 模型 扩展 了 关系 数据 模型 的 方式 是 通过 提供 一 个 包括 复杂 数据 类 型 和 面向 
对 象 的 更 丰富 的 类 型 系统 。 关 系 查询 语言 也 需要 做 相应 的 扩展 以 处 理 这 些 更 丰富 的 类 型 系统 。 
对 象 关系 数据 库 系统 是 以 对 象 关系 数据 模型 为 基础 的 ， 它 为 想 要 使 用 面向 对 象 特征 的 关系 数据 
库 用 户 提供 了 一 个 方便 的 迁移 途径 。 


1， 庆 套 关 系 


在 关系 数据 理论 中 定义 了 第 一 范式 ， 它 要 求 所 有 的 属性 都 具有 原子 的 域 。 原 子 域 是 指 这 个 

域 中 的 元 素 是 不 可 再 分 的 单元 。 然 而 并 非 所 有 的 应 用 都 是 用 第 一 范式 关系 建 模 最 好 。 例 如 ， 某 
些 应 用 的 用 户 将 数据 库 视 为 对 象 的 一 个 集合 ， 而 不 是 记录 的 一 个 集合 ， 这 些 对 象 可 能 需要 数 条 
记录 来 表示 。 一 个 简单 、 易 用 的 界面 要 求 用 户 直观 概念 上 的 一 个 对 象 与 数据 库 系统 概念 上 的 一 
个 数据 项 之 间 是 一 一 对 应 的 关系 。 
嵌 套 关系 模型 是 关系 模型 的 一 个 的 扩展 ， 域 可 以 是 原子 的 也 可 以 赋值 为 关系 。 这 样 元 组 在 
属性 上 的 取 值 可 以 是 一 个 关系 ， 于 是 关系 可 以 存储 在 关系 中 ， 从 而 形成 了 关系 的 拒 套 。 这 
样 一 个 复杂 对 象 就 可 以 用 嵌 套 关系 的 单个 元 组 来 表示 。 如 果 我 们 将 嵌 套 关系 的 一 个 元 组 视 为 一 
个 数据 项 ， 在 数据 项 和 用 户 数据 库 观 念 上 的 对 象 之 间 我 们 就 有 了 一 一 对 应 的 关系 。 


| 
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2， 复 杂 类 型 


贬 套 关系 只 是 对 基本 关系 模型 扩展 的 一 个 实例 ， 其 他 非 原子 数据 类 型 ， 如 嵌 套 记录 ， 同 样 
已 被 证 明 是 有 用 的 。 面 向 对 象 数据 模型 已 经 导致 了 对 于 如 对 象 的 继承 、 引 用 等 特征 的 需求 。 有 
了 复杂 对 象 系统 和 面向 对 象 , 我 们 能 够 直接 表达 E-R 模型 的 一 些 概念 , 如 实体 标识 、 多 值 属性 、 
一 般 化 和 特殊 化 ， 而 不 再 需要 经 过 关系 模型 的 复杂 转化 。 

通过 对 SQL 的 扩展 ， 我 们 可 以 使 用 复杂 类 型 。 下 面 对 复 杂 类 型 的 一 些 简 单 概念 加 以 介绍 。 

下 面 是 对 一 个 books 表 的 定义 : 


create table books ( 
1 setof (varchar (20) 

这 个 表 中 的 keyword 属性 比较 特殊 ， 因 为 它 允 许 属性 是 集合 。 

集合 是 集合 体 类 型 的 一 个 实例 ， 其 他 的 集合 体 类 型 包括 数组 和 多 重 集合 。 因 此 不 同 于 普通 
关系 数据 库 中 表 的 定义 ， 人 允许 属性 是 集合 ， 从 而 E-R 图 中 的 多 值 属性 能 够 直接 表述 。 

现在 许多 的 数据 库 应 用 需要 存储 的 属性 很 大 ， 如 一 个 人 的 照片 ， 或 者 更 大 的 ， 如 高 分 辩 率 
的 医学 图 像 或 者 录像 剪辑 。 在 SQL:1999 中 提供 了 新 字符 型 数据 大 对 象 数 据 类 型 和 二 进 制 数据 
大 对 象 数 据 类 型 。 大 对 象 一 般 用 于 外 部 的 应 用 ， 通 过 SQL 对 它们 进行 全 体检 索 是 毫 无 意义 的 。 
取而代之 ， 应 用 程序 一 般 只 检索 大 对 象 的 定位 器 ， 然 后 用 定位 器 从 宿主 语言 中 操作 该 对 象 。 

下 面 说 明 结 构 类 型 的 声明 和 使 用 : 


create type MyString char varying 
create type MyDate 

(day integer, 

month char (10) ， 

year integer) 
create type Document 

(name MyString, 

author-list setof (MyString) ， 

date MyDate, 

keyword-list setof (MyString) 
create table doc of type Document 


第 一 个 语句 定义 了 一 个 类 型 MyString， 它 是 一 个 变 长 的 字符 串 。 第 二 个 语句 定义 了 一 个 类 
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型 MyDate， 它 有 三 个 组 成 部 分 : date、month 和 year。 


第 三 个 语句 定义 了 一 个 类 型 Document， 


它 包含 一 个 name、 一 个 作者 的 集合 author-list、 一 个 类 型 为 MyDate 的 日 期 以 及 一 个 关键 词 集 
合 。 最 后 创建 表 doc， 它 包含 了 类 型 为 Document 的 元 组 。 上 述 表 的 定义 与 普通 关系 数据 库 中 的 
表 定 义 是 有 区 别 的 ， 因 为 前 者 允许 属性 为 集合 或 者 如 MyDate 那样 的 属性 具有 结构 类 型 ， 这 些 
特征 使 得 E-R 图 中 的 复合 属性 及 多 值 属性 能 够 直接 表达 。 


3， 继承 、 引 用 类 型 


是 在 SQL 标准 的 未 来 版 本 中 会 介绍 到 的 一 些 特征 。 


在 这 里 介绍 的 是 基于 SQL:1999 标准 的 ， 不 过 也 会 提 到 一 些 在 这 个 标准 中 没有 出 现 的 ,但 


继承 可 以 在 类 型 的 级 别 进行 ， 也 可 以 在 表 的 级 别 上 进行 。 首 先 考虑 类 型 的 继承 。 


假定 我 们 有 如 下 的 人 的 类 型 定义 : 


create type Person 
(name varchar (20) ， 
address varchar (20)) 


如 果 要 在 数据 库 中 对 那些 是 学 生 或 教师 的 人 分 别 存储 一 些 额外 的 信息 ， 由 于 学 生 和 教师 都 
是 人 ， 因 而 可 以 使 用 类 型 继承 来 定义 学 生 和 教师 类 型 如 下 : 


create type Student 
under Person 
(degree varchar (20) ， 
department varchar (20)) 
create type Teacher 
under Person 
(salary integer, 
department varchar (20)) 


Student 和 Teacher 都 继承 了 Person 的 属性 ， 即 name 和 address。Student 和 Teacher 都 被 称 
为 Person 的 子 类 型 ，Person 是 Student 的 父 类 型 ， 同 时 也 是 Teacher 的 父 类 型 。 


现在 假定 要 存储 关于 助教 的 信息 , 这 些 助教 既是 学 生 又 是 教师 , 甚至 可 能 是 在 不 同 的 系 里 。 


如 果 类 型 系统 支持 多 重 继承 ， 可 以 为 助教 定义 一 个 类 型 如 下 : 


create type TeacherAssistant 
under Student, Teacher 


TeacherAssistant 将 继承 Student 和 Teacher 的 所 有 


属性 ， 但 是 却 有 一 个 问题 ， 因 为 name、 


address 和 department 同时 存在 于 Student 和 Teacher 中 。 
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name 和 address 属性 实际 上 是 从 同一 个 来 源 即 Person 继承 来 的 ， 因 此 同时 从 Student 和 
Teacher 中 都 继承 这 两 个 属性 不 会 引起 冲突 。 然 而 department 属性 在 Student 和 Teacher 中 分 别 
都 有 定义 ， 事 实 上 ， 一 个 助教 可 能 是 某 个 系 的 学 生 同 时 又 是 另 一 个 系 的 教师 。 为 了 避免 两 次 出 
现 的 department 之 间 的 冲突 ， 可 以 使 用 as 子 句 将 它们 重新 命名 ， 如 下 面 的 TeacherAssistant 类 
型 定义 如 下 : 


create type TeacherAssistant 
under Student with (department as student-dept) ， 
Teacher with (department as teacher-dept) 


在 SQL:1999 中 只 支持 单 继承 ， 即 一 个 类 型 只 能 继承 一 种 类 型 ， 使 用 的 语法 如 同 前 面 提 到 
的 例子 。TeacherAssistant 例子 中 的 多 重 继承 在 SQL:1999 中 是 不 支持 的 。 

我 们 通过 下 面 的 例子 来 说 明 表 继承 。 

假设 定义 people 表 如 下 : 


create table people of Person 


那么 再 定义 表 students 和 teachers 作为 people 的 子 表 ， 如 下 : 


create table students of Student 
under people 

create table teachers of Teacher 
under people 


子 表 的 类 型 必须 是 父 表 类 型 的 子 类 型 ， 因 此 people 中 的 每 一 个 属性 均 出 现在 子 表 中 。 

当 我 们 声明 students 和 teachers 作为 people 的 子 表 时 , 每 一 个 students 和 teachers 中 出 现 的 
元 组 也 隐 式 存在 于 people 中 。 所 以 ， 如 果 一 个 查询 用 到 people 表 ， 它 将 查找 的 不 仅仅 是 直接 插 
入 到 这 个 表 中 的 元 组 ， 而 且 还 包含 插入 到 它 的 子 表 students 和 teachers 中 的 元 组 。 然 而 ， 只 有 
出 现在 people 中 的 属性 才 可 以 被 访问 。 
面向 对 象 的 程序 设计 语言 提供 了 应 用 对 象 的 能 力 ， 类 型 的 一 个 属性 可 以 是 对 一 个 指定 类 型 
的 对 象 的 引用 。 我 们 可 以 定义 一 个 Department 类 型 ， 它 有 一 个 name 字段 和 一 个 引用 到 Person 
类 型 的 head 字段 ， 然 后 定义 一 个 Department 类 型 的 表 departments， 如 下 所 示 : 


create type Department 

(name varchar (20) ， 

head ref (Person) scope people) 
create table departments of Department 


在 上 面 的 定义 中 , 使 用 关键 词 scope 来 限定 了 引用 范围 。 这 里, 引用 限制 在 people 表 中 的 元 组 。 
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4. 与 复杂 类 型 有 关 的 查询 


这 里 要 介绍 的 是 处 理 复杂 类 型 的 扩展 SQL 查询 语言 。 与 复杂 类 型 有 关 的 查询 可 以 分 为 如 下 


几 类 : 
1) 路 径 表 达 式 


名 字 和 地 址 : 


select head >name, head>address 
from departments 


在 上 面 的 查询 中 ， 带 有 符号 的 表达 式 被 称 为 路 径 表 达 式 。 


2) 以 集合 体 为 值 的 属性 
如 果 我 们 想 找 出 所 有 的 码 中 包含 “database” 字 样 的 书 ， 如 下 查询 即 可 : 


select title 
from books 
Where ‘database’ in (unnest (keyword-set)) 


在 SQL:1999 中 对 引用 取 内 容 使 用 ?> 符号。 可 以 使 用 下 面 的 查询 来 找 出 各 个 部 门 负责 人 的 


unnest (keyword-set) 在 无 嵌 套 关系 的 SQL 中 相当 于 一 个 select-from-where 的 子 表达 式 。 


(3) 顽 套 与 解除 嵌 套 


将 一 个 霸 套 关系 转换 成 为 INF 的 过 程 称 为 解除 嵌 套 。 关 系 doc 有 author-list 和 keyword- 


list 


两 个 属性 ， 这 两 者 都 是 嵌 套 关系 ， 同 时 关系 doc 另外 还 有 name 和 date 两 个 属性 ， 它 们 都 不 是 
拒 套 关系 。 假 定 想 要 将 该 关系 转化 为 单个 平面 关系 ， 使 其 不 包含 嵌 套 关系 或 者 结构 类 型 作为 属 


性 ， 可 以 使 用 以 下 查询 来 完成 这 个 任务 : 
select name , A as author date.day, date.month, date.year, K as keyword 
from doc as B, B.author-list as A, B.keyword-list as K 
from 子 句 中 的 变量 B 被 声明 以 doc 为 取 值 范围 , 变量 A 被 声明 以 该 文档 的 author-list 9 
作者 为 取 值 范围 ， 同 时 K 被 声明 以 该 文档 的 keyword-list 的 关键 词 为 取 值 范 


的 


反 向 过 程 即将 一 个 INF 关系 转化 为 嵌 套 关系 称 为 嵌 套 。 媒 套 可 以 用 对 sQL 分 组 的 一 个 扩 
展 来 完成 。 在 SQL 分 组 的 常规 使 用 中 ， 需 要 对 每 个 组 创建 一 个 临时 的 多 重 集合 关系 ， 然 后 在 这 
个 临时 关系 上 应 用 一 个 聚集 函数 。 如 果 不 应 用 聚集 函数 而 只 返回 这 个 多 重 集合 ， 我 们 就 可 以 创 
建 一 个 嵌 套 关系 。 假 定 有 一 个 INF 关系 flat-doc， 下面 的 查询 在 属性 keyword 上 对 关系 进行 了 嵌 套 : 


select title, author, (date, month, year) as date, set (keyword) as keyword-list 
from flat-doc 
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group by title, author date 
S， 函 数 与 过 程 


在 对 象 关系 数据 库 系 统 中 允许 用 户 定义 函数 与 过 程 ， 它 们 既 可 以 用 某 种 数据 操纵 语言 如 
SQL 来 定义 ， 也 可 以 通过 外 部 的 程序 设计 语言 来 定义 ， 例 如 Java、C 或 CH+。 有 些 数据 库 管 理 
系统 支持 它们 自己 的 过 程 语言 ,如 Oracle 中 的 PL/SQL 和 Microsoft SQLServer 中 的 TransactSQL， 
它们 类 似 于 SQL 的 有 关 过 程 的 部 分 , 但 在 语法 和 语义 上 有 所 区 别 , 详细 信息 可 参见 各 自 的 系统 
手册 。 


假设 定义 这 样 一 个 函数 : 给 定 一 个 文档 ， 返 回 其 作者 的 人 数 。 可 以 定义 这 个 函数 如 下 : 


create function author-count (one-doc Document) 


7 


return integer as 
Select count (author-list) 
from one-doc 


这 里 Document 是 一 个 类 型 名 。 这 个 函数 用 单个 文档 对 象 来 调用 , select 语句 同 关系 one-doc 
一 起 执行 ， 这 个 关系 仅 包 括 单个 元 组 ， 即 函数 的 参数 。 这 个 select 语句 的 结果 是 单个 值 、 严 格 
来 讲 ， 它 是 一 个 只 有 单个 属性 的 元 组 ， 其 类 型 被 转化 为 一 个 值 。 

上 面 的 函数 可 以 使 用 在 如 下 查询 中 ， 该 查询 返回 具有 多 于 一 个 作者 的 所 有 文档 的 名 称 : 


select name 
from doc 
where author-count (doc) >1 


注意 ， 上 面 的 SQL 表达 式 中 ， 尽 管 在 from 子 句 中 doc 是 指 一 个 关系 ， 但 在 where 子 句 中 
它 隐 含 地 被 视 为 一 个 元 组 变量 ， 因 此 它 可 以 用 来 作为 author-count 函数 的 一 个 参数 。 

有 些 数据 库 系统 允许 我 们 使 用 如 C 或 C++ 这 样 的 程序 设计 语言 来 定义 函数 。 用 这 种 方式 定 
义 的 函数 比 用 SQL 定义 的 函数 效率 更 高 ， 并 且 能 够 执行 有 些 无 法 用 SQL 完成 的 计算 。 使 用 这 
些 函 数 的 例子 有 很 多 ， 如 在 一 个 元 组 的 数据 上 做 一 个 复杂 的 算法 。 

用 程序 设计 语言 定义 的 函数 在 数据 库 系 统 的 外 部 编译 ， 它 们 需要 被 装 入 并 与 数据 库 系统 代 
码 一 起 执行 。 这 个 过 程 要 冒 一 定 的 风险 ， 因 为 程序 中 的 错误 可 能 会 破坏 数据 库 的 内 部 结构 ， 并 
且 可 能 绕道 数据 库 系统 的 存 取 控 制 功能 。 

使 用 程序 设计 语言 定义 的 函数 看 起 来 与 使 用 嵌入 式 SQL 没什么 不 一 样 ， 使 用 嵌入 式 SQL 
时 数据 库 查询 包含 在 一 个 通用 程序 中 ， 但 是 它们 之 间 还 是 有 一 个 重要 差别 。 在 嵌入 式 SQL 中 ， 
用 户 程序 将 查询 传送 给 数据 库 系 统 执行 ， 结 果 以 一 次 一 个 元 组 的 形式 返回 给 该 程序 。 因 此 ， 用 
户 书写 的 代码 永远 不 会 需要 访问 数据 库 本 身 ， 于 是 操作 系统 就 可 以 保护 数据 库 不 被 任何 用 户 进 
程 所 存 取 。 当 在 查询 中 使 用 用 户 编码 的 函数 时 ， 要 么 这 些 代 码 必 须 由 数据 库 系统 本 身 运 行 ， 要 
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么 该 函数 所 操作 的 数据 必须 被 拷贝 到 一 个 分 离 的 数据 空间 中 。 第 二 种 方法 增加 了 系统 开销 ， 第 
一 种 方法 则 诱发 了 潜在 的 脆弱 性 ， 这 同时 表现 在 完整 性 方面 和 安全 性 方面 。 


6. 面向 对 象 与 对 象 关系 


我 们 已 经 研究 了 建立 在 持久 化 程序 设计 语言 上 的 面向 对 象 数据 库 ， 也 研究 了 建立 在 关系 模 
型 之 上 的 面向 对 象 的 对 象 关系 数据 库 。 这 两 种 类 型 的 数据 库 系统 在 市 场 上 都 存在 ， 数 据 库 设计 
者 要 选择 那 种 适合 应 用 需求 的 系统 。 

程序 设计 语言 的 持久 化 扩展 和 对 象 关系 系统 有 着 不 同 的 市 场 目标 。SQL 语言 的 声明 性 特征 
和 有 限 的 能 力 为 防止 程序 设计 错误 对 数据 造成 破坏 提供 了 很 好 的 保护 ， 同 时 使 得 一 些 高 级 优 
化 ， 例 如 减少 JO， 变 得 相对 简单 。 对 象 关系 系统 的 目标 在 于 通过 使 用 复杂 数据 类 型 来 简化 数 
据 建 模 和 查询 ， 典 型 的 应 用 有 复杂 数据 的 存储 和 查询 等 。 

然而 , 对 于 某 些 类 型 的 应 用 , 如 主要 在 内 存 中 运行 和 对 数据 库 进行 大 批量 访问 的 应 用 来 说 ， 
一 个 说 明 性 语言 , 如 SQL 会 带 来 显著 的 性 能 损失 。 满 足 应 用 的 高 性 能 要 求 就 是 持久 化 程序 设计 
语言 的 目标 。 持 久 化 程序 设计 语言 提供 了 对 持久 数据 的 低 开销 存 取 ， 并 且 取 消 了 数据 转换 的 要 
求 。 但是， 持久 化 程序 设计 语言 对 由 于 程序 错误 而 引起 的 数据 破坏 更 为 敏感 ， 而 且 通 常 没有 强 
大 的 查询 能 力 。 它 们 典型 的 应 用 包括 CAD 数据 库 。 

这 些 不 同 种 类 的 数据 库 系 统 的 能 力 可 以 总 结 如 下 。 

。 关系 系统 : 简单 数据 类 型 、 功 能 强大 的 查询 语言 、 高 保护 性 。 

。 以 持久 化 程序 设计 语言 为 基础 的 面向 对 象 系统 : 复杂 数据 类 型 、 与 程序 设计 语言 

集成 ， 高 性 能 。 

。 对象 关系 系统 : 复杂 数据 类 型 、 功 能 强大 的 查询 语言 、 高 保护 性 。 

这 些 描述 具有 普遍 性 ， 但 是 请 记 住 对 有 些 数据 库 系 统 来 说 它们 的 分 界线 是 模糊 的 。 例 如 ， 
有 些 以 持久 化 程序 设计 语言 为 基础 的 面向 对 象 数据 库 系 统 是 在 一 个 关系 数据 库 系 统 之 上 实现 
的 ， 这 些 系统 的 性 能 可 能 比 不 上 那些 直接 建立 在 存储 系统 之 上 的 面向 对 象 数 据 库 系 统 ， 但 这 些 
系统 却 提供 了 关系 系统 所 具有 的 较 强 的 保护 能 力 。 


12.5 决策 支持 系统 与 数据 库 


12.5.1 决策 支持 系统 的 概念 


决策 支持 系统 (Decision Support System，DSS) 是 目前 迅速 发 展 起 来 的 新 型 计算 机 学 科 ， 
最 早 于 20 世纪 70 年 代 初 由 美国 M. S. Scott Morton 教授 在 《管理 决策 系统 》 一 文中 首先 提出 。 
决策 支持 系统 实质 上 是 在 管理 信息 系统 的 基础 上 发 展 起 来 的 。 管 理 信息 系统 是 将 计算 机 应 
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用 于 一 个 单位 或 部 门 的 各 种 业务 处 理 的 系统 。 它 将 数据 处 理 和 经 济 管理 结合 起 来 ， 形 成 了 用 于 
管理 的 信息 系统 。 它 的 定义 可 以 认为 是 : 管理 信息 系统 是 一 个 由 人 、 计 算 机 结合 的 对 管理 信息 
进行 收集 、 传 递 、 存 储 、 加 工 、 维 护 和 使 用 的 系统 。 管 理 信息 系统 可 简单 地 理解 为 : 

管理 信息 系统 = 管理 业务 十 数据 库 技术 

各 种 类 型 的 管理 业务 主要 是 以 账本 和 处 理 过 程 为 核心 的 ， 数 据 库 技术 主要 是 数据 库 系统 和 
数据 处 理 程序 。 数 据 库 系 统 是 由 数据 库 管理 系统 和 数据 库 组 成 的 。 数 据 处 理 程序 是 使 用 数据 库 
语言 对 管理 功能 中 的 处 理 过 程 编 写 出 的 程序 。 数 据 库 语言 是 一 种 数据 处 理 语言 ， 它 具有 对 数据 
库 的 建立 、 增 加 、 删 除 、 更 新 、 查 询 、 统 计 、 恢 复 、 报 表 等 功能 ， 以 及 计算 机 语言 的 基本 结构 ， 
如 顺序 、 选 择 、 循 环 。 管 理 功能 中 账本 的 数据 按 数据 库 结构 形式 存 入 数据 库 中 。 

通过 引入 数学 模型 ， 我 们 可 以 增强 对 复杂 问题 的 处 理 能 力 ， 使 人 们 尽 可 能 地 按 客 观 规律 办 
事 ， 避 免 错 误 ， 取 得 预期 的 效果 。 这 样 的 系统 我 们 称 之 为 模型 辅助 决策 系统 。 

模型 是 辅助 决策 的 重要 手段 ， 是 专家 学 者 在 探索 事物 的 变化 规律 中 抽象 出 的 数学 模型 。 这 
项 工作 是 创造 性 劳动 ， 需 要 花费 大 量 的 精力 和 敏感 思维 来 得 到 规律 性 或 相近 的 数学 模型 。 数 学 
模型 建立 后 的 一 个 重要 问题 就 是 该 模型 的 求解 算法 ， 它 可 以 是 精确 求解 ， 也 可 以 是 近似 求解 。 
有 了 模型 算法 ， 我 们 就 可 以 用 计算 机 语言 来 编制 成 程序 。 实 际 的 决策 者 就 可 以 在 计算 机 上 执行 
模型 程序 ， 计 算出 结果 ， 得 到 辅助 决策 信息 。 

模型 辅助 决策 系统 一 般 是 用 单个 典型 模型 来 解决 某 类 的 决策 问题 。 随 着 管理 信息 系统 的 发 
展 ， 在 管理 信息 系统 中 除 完成 大 量 的 数据 组 织 、 存 储 、 查 询 、 统 计 、 报 表 生 成 等 主要 工作 外 ， 
还 要 逐步 增加 模型 辅助 决策 的 功能 。 

随 着 新 技术 的 发 展 ， 所 需要 解决 的 问题 会 愈 来 愈 复杂 ， 除 了 完成 一 般 管 理 信 息 系统 的 要 求 
外 ， 亡 涉及 的 模型 愈 来 愈 多， 不 仅 是 几 个 ， 而 是 十 多 个 、 几 十 个 、 以 至 上 百 个 模型 来 解决 同一 
个 问题 。 这 样 的 问题 ， 使 用 管理 信息 系统 或 者 模型 辅助 决策 系统 都 不 能 解决 ， 需 要 应 用 决策 支 
持 系 统 。 决 策 支 持 系统 的 新 特点 就 是 增加 了 模型 库 和 模型 库 管 理 系统 。 它 把 众多 的 模型 有 效 地 
组 织 和 存储 起 来 ， 把 模型 库 和 数据 库 有 机 地 结合 起 来 。 决 策 支持 系统 的 基本 结构 如 图 12-12 所 示 。 

综 上 所 述 ， 决 策 支持 系统 的 定义 为 :综合 利用 各 种 数据 、 信 息 、 知 识 ， 特 别 是 模型 技术 ， 
辅助 各 级 决策 者 解决 决策 问题 的 人 机 交互 系统 。 

决策 支持 系统 由 下 列 的 子 系统 组 成 。 

(1) 数据 库 子 系统 。 包 括 数据 库 ， 其 中 包含 关于 决策 问题 的 有 关 数 据 ， 并 由 数据 库 管理 系 
统 进行 管理 。 

(2) 模型 库 子 系统 。 包 括 模型 库 ， 其 中 包含 财务 、 统 计 、 管 理科 学 或 其 他 定量 模型 ， 可 提 
供 系 统 的 分 析 功 能 ， 由 模型 库 管理 系统 为 用 户 提供 建 模 语言 以 及 模型 库 管理 功能 。 

(3) 人 机 交互 系统 。 通 过 该 子 系统 ， 用 户 与 决策 支持 系统 通信 并 使 用 决策 支持 系统 ， 协 调 
和 控制 数据 库 子 系统 和 模型 库 子 系统 的 管理 和 运行 。 
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〈4) 用户。 用户 也 是 系统 的 一 部 分 ， 研 究 人 员 认 为 用 户 与 计算 机 的 频繁 对 话 可 以 产生 决策 


支持 系统 某 些 特殊 的 作用 。 


在 决策 支持 系统 基本 结构 的 基础 上 , 增加 知识 库 子 系统 , 就 形成 了 智能 决策 支持 系统 结构 。 
该 结构 中 的 知识 库 子 系统 包括 知识 库 和 推理 机 。 知 识 库 子 系统 能 支持 其 他 子 系统 或 作为 独立 的 
部 件 应 用 ， 它 提供 智能 和 定性 分 析 功 能 ， 以 增强 决策 人 的 能 力 。 


12.5.2 ”数据 仓库 设计 
由 于 数据 库 面向 日 常事 务 处 


E， 不 适合 进行 分 析 处 理 ， 一 种 新 的 技术 应 运 而 生 ， 这 就 是 数 


据 仓库 技术 。 数 据 仓库 技术 是 公认 的 信息 利用 的 最 佳 解决 方案 ， 它 不 仅 能 够 从 容 解决 信息 技术 
人 员 面 临 的 问题 ， 同 时 也 为 商业 用 户 提供 了 很 好 的 商业 契机 。 

数据 仓库 已 成 为 决策 支持 系统 建立 的 重要 技术 手段 ， 是 建立 决策 支持 系统 的 基础 。 在 这 一 
节 里 ， 我 们 将 讨论 数据 仓库 的 系统 设计 方法 ， 建 设 数据 仓库 的 三 级 数据 模型 ， 如 何 提高 数据 仓 
库 的 物理 性 能 ， 以 及 数据 仓库 的 元 数据 等 有 关内 容 。 

数据 仓库 的 数据 具有 四 个 基本 特征 : 面向 主题 的 、 集 成 的 、 不 可 更 新 的 、 随 时 间 不 断 变化 


的 。 这 些 特点 说 明了 数据 仓库 从 数据 组 织 到 面向 分 析 的 数据 处 理 都 与 原来 的 数据 库 有 较 大 区 
别 ， 这 决定 了 我 们 在 进行 数据 仓库 系统 设计 时 ， 不 能 够 照搬 原来 传统 的 数据 库 系 统 开发 方法 ， 
因而 需要 寻找 一 个 适 于 数据 仓库 设计 的 方法 。 


所 谓 数据 模型 ， 就 是 对 现实 世界 进行 抽象 的 工具 ， 抽 象 的 程度 不 同 ， 也 就 形成 了 不 同 抽象 


级 别 层次 上 的 数据 模型 。 数 据 仓库 的 数据 模型 与 操作 型 数据 库 的 三 级 数据 模型 又 有 一 定 的 区 
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别 ， 主 要 表现 在 如 下 几 个 方面 。 

(1) 数据 仓库 的 数据 模型 中 不 包含 纯 操 作 型 的 数据 。 

(2) 数据 仓库 的 数据 模型 扩充 了 码 结构 ， 增 加 了 时 间 属 性 作为 码 的 一 部 分 。 

(3) 数据 仓库 的 数据 模型 中 增加 了 一 些 导 出 数据 。 

可 以 看 出 ， 上 述 三 点 差别 也 就 是 操作 型 环境 中 的 数据 与 数据 仓库 中 的 数据 之 间 的 差别 ， 同 
样 也 是 数据 仓库 为 面向 数据 分 析 处 理 所 要 求 的 。 虽 然 存 在 着 这 样 的 差别 ， 在 数据 仓库 设计 中 ， 
仍然 存在 着 三 级 数据 模型 ， 即 概念 模型 、 逻 辑 模 型 和 物理 模型 。 

概念 模型 是 主观 与 客观 之 间 的 桥梁 ， 它 是 一 个 概念 性 的 工具 ， 用 于 设计 系统 、 收 集 信息 。 
具体 到 计算 机 系统 来 说 ， 概 念 模型 是 客观 世界 到 机 器 世界 的 一 个 中 间 层 次 。 人 们 首先 将 现实 世 
界 抽象 为 信息 世界 ， 然 后 将 信息 世界 转化 为 机 器 世界 ， 信 息 世 界 中 的 这 一 信息 结构 ， 即 是 我 们 
所 说 的 概念 模型 。 

概念 模型 最 常用 的 表示 方法 是 使 用 E-R 图 作为 它 的 描述 工具 。E-R 图 描述 的 是 实体 以 及 实 
体 之 间 的 联系 ， 在 E-R 图 中 ， 长 方形 表示 实体 ， 在 数据 仓库 中 就 表示 主题 ， 在 长 方形 内 写 上 主 
题名 ;椭圆 形 表示 主 题 的 属性 ， 并 用 无 向 边 把 主题 与 其 属性 连接 起 来 ， 用 菱形 表示 主题 之 间 的 
联系 ， 萎 形 框 内 写 上 联系 的 名 字 。 用 无 向 边 把 鞭 形 分 别 与 有 关 的 主题 连接 ， 给 无 向 边 标 记 上 联 
系 的 类 型 。 若 主题 之 间 的 联系 也 具有 属性 ， 则 把 属性 和 菱形 也 用 无 向 边 连 接 上 。 

由 于 E-R 图 具有 良好 的 可 操作 性 ， 形 式 简单 ， 易 于 理解 ， 便 于 与 用 户 交 流 ， 对 客观 世界 的 
描述 能 力也 较 强 ， 在 数据 库 设 计 方面 更 得 到 了 广泛 的 应 用 。 因 为 目前 的 数据 仓库 一 般 建 立 在 关 
系数 据 库 的 基础 之 上 ， 为 了 和 原 有 数据 库 的 概念 模型 相 一 致 ， 采 用 E-R 图 作为 数据 仓库 的 概念 
模型 仍然 是 较为 合适 的 。 

在 数据 仓库 的 设计 中 采用 的 逻辑 模型 就 是 关系 模型 。 无 论 是 主题 还 是 主题 之 间 的 联系 ， 都 
用 关系 来 标识 。 关 系 模型 概念 简单 、 清 晰 ， 用 户 易 懂 、 易 用 ， 有 严格 的 数学 基础 和 在 此 基础 上 
发 展 的 关系 数据 理论 ， 关 系 模型 简化 了 程序 员 的 工作 和 数据 仓库 设计 开发 的 工作 ， 当 前 比较 成 
熟 的 商品 化 数据 库 产品 都 是 基于 关系 模型 的 。 因 此 采用 关系 模型 作为 数据 仓库 的 逻辑 模型 是 合 
适 的 。 数 据 仓库 的 逻辑 模型 描述 了 数据 仓库 的 主题 的 逻辑 实现 ， 即 每 个 主题 所 对 应 的 关系 表 的 
关系 模式 的 定义 。 

所 谓 数据 仓库 的 物理 模型 就 是 逻辑 模型 在 数据 仓库 中 的 实现 ， 如 物理 存 取 方式 、 数 据 存储 
结构 、 数 据 存放 位 置 以 及 存储 分 配 等 。 物 理 模 型 是 在 逻辑 模型 的 基础 之 上 实现 的 ， 在 进行 物理 
模型 设计 实现 时 ， 所 考虑 的 主要 因素 有 : IO 存 取 时 间 、 空 间 利 用 率 和 维护 代价 ， 在 进行 数据 
仓库 的 物理 模型 设计 时 ， 考 虑 到 数据 仓库 的 数据 量 大 ， 但 是 操作 单一 的 特点 ， 可 采取 其 他 的 一 
些 提 高 数据 仓库 性 能 的 技术 ， 如 : 合并 表 、 建 立 数据 序列 、 引 入 元 余 、 进 一 步 细 分 数据 、 生 成 
导出 数据 、 建 立 广义 索引 等 。 

建立 数据 仓库 过 程 中 一 个 重要 问题 是 如 何 提高 系统 的 性 能 。 因 为 数据 仓库 的 数据 量 很 大 ， 
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分 析 处 理 时 涉及 的 数据 范围 也 较 广 ， 往 往 涉及 大 规模 数据 的 查询 。 提 高 系统 性 能 ， 主 要 是 要 提 
高 系统 的 物理 IO 性 能 ， 因 为 IO 瓶颈 常 成 为 影响 系统 性 能 的 主要 因素 。 在 数据 仓库 的 设计 中 ， 
应 尽量 减少 每 次 查询 处 理 要 求 的 IO 次 数 ， 而 使 每 次 IO 又 能 返回 尽量 多 的 记录 。 事 实 上 ， 由 
于 数据 仓库 的 数据 极 少 甚至 不 再 更 新 ， 数 据 仓库 的 物理 设计 可 以 有 更 多 的 方法 和 途径 来 提高 系 
统 性 能 。 下 面 介绍 粒度 划分 和 数据 分 割 。 

1) 粒度 划分 

对 数据 仓库 开发 者 来 说 ， 划 分 粒度 是 设计 过 程 中 最 重要 的 问题 之 一 。 所 谓 粒度 指数 据 仓库 
中 数据 单元 的 详细 程度 和 级 别 。 数 据 越 详 细 ， 粒 度 越 小 级 别 就 越 低 ， 数 据 综合 度 越 高 ， 粒 度 越 
大 级 别 就 越 高 。 在 传统 的 操作 型 系统 中 ， 对 数据 的 处 理 和 操作 都 是 在 详细 数据 级 别 上 的 ， 即 最 
低级 的 粒度 。 但 是 在 数据 仓库 环境 中 主要 是 分 析 型 处 理 ， 粒 度 的 划分 将 直接 影响 数据 仓库 中 的 
数据 量 以 及 所 适合 的 查询 类 型 。 一 般 需 要 将 数据 划分 为 : 详细 数据 、 轻 度 总 结 、 高 度 总 结 三 级 
或 更 多 级 粒度 。 不 同 粒度 级 别 的 数据 用 于 不 同类 型 的 分 析 处 理 。 粒 度 的 划分 是 数据 仓库 设计 工 
作 的 一 项 重要 内 容 ， 粒 度 划 分 是 否 适 当 是 影响 数据 仓库 性 能 的 一 个 重要 方面 。 

2) 数据 分 割 

数据 分 割 是 数据 仓库 设计 另 一 项 重要 内 容 ， 是 提高 数据 仓库 性 能 的 一 项 重要 技术 。 数 据 的 
分 割 是 指 把 逻辑 上 是 统一 整体 的 数据 分 割 成 较 小 的 、 可 以 独立 管理 的 物理 单元 进行 存储 ， 以 便 
于 重 构 、 重 组 和 恢复 ， 以 提高 创建 索引 和 顺序 扫描 的 效率 。 数 据 的 分 割 使 数据 仓库 的 开发 人 员 
和 用 户 具 有 更 大 的 灵活 性 。 数 据 仓库 中 数据 分 割 的 概念 与 数据 库 中 的 数据 分 片 概念 是 相近 的 。 
数据 库 系 统 中 的 数据 分 片 有 水 平分 片 、 垂 直 分 片 、 混 合 分 片 和 导出 分 片 多 种 方式 。 水 平分 片 是 
指 按 一 定 的 条 件 将 一 个 关系 按 行 分 为 若干 不 相交 的 子 集 ， 每 个 子 集 为 关系 的 一 个 片段 垂直 分 
片 是 指 将 关系 按 列 分 为 若干 子 集 ， 垂 直 分 片 的 片段 必须 能 够 重 构 原来 的 全 局 关系 。 
在 进行 数据 仓库 设计 时 需要 把 数据 分 割 与 粒度 划分 结合 起 来 考虑 。 

数据 仓库 中 的 元 数据 就 是 关于 数据 的 数据 ， 它 描述 了 数据 的 结构 、 内 容 、 码 、 索 引 等 项 内 
容 。 传 统 数据 库 中 的 数据 字典 是 一 种 元 数据 ， 但 在 数据 仓库 中 ， 元 数据 的 内 容 比 数据 库 中 的 数 
据 字 典 更 丰富 、 更 复杂 。 设 计 一 个 描述 能 力 强 、 内 容 完善 的 元 数据 ， 是 有 效 管理 数据 仓库 、 具 
有 决定 意义 的 重要 前 提 。 因 此 元 数据 的 设计 在 整个 数据 仓库 设计 中 占有 重要 的 地 位 ， 是 数据 仓 
库 设 计 的 一 个 重要 组 成 部 分 。 

数据 仓库 中 的 元 数据 的 重要 性 表现 如 下 。 

(1) 数据 仓库 服务 于 决策 支持 系统 分 析 员 以 及 高 层 决策 人 员 ， 而 这 一 部 分 人 员 往 往 把 使 用 
元 数据 作为 分 析 的 第 一 步 。 例 如 ， 数 据 仓库 元 数据 中 的 广义 索引 中 存 有 在 每 次 数据 装载 时 产生 
的 部 分 有 关 决 策 的 数据 ， 在 做 决策 时 ， 可 以 先 去 查找 这 部 分 数据 ， 再 决定 是 否 进行 进一步 的 
搜索 。 

(2) 操作 型 环境 和 数据 仓库 环境 之 间 有 着 复杂 的 、 多 方面 的 区 别 ， 因 此 从 操作 型 环境 到 数 
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据 仓库 的 数据 转换 也 是 复杂 的 、 多 方面 的 。 元 数据 应 包含 对 这 种 转换 的 描述 。 元 数据 要 将 这 种 
转换 清晰 地 表示 出 来 ， 把 从 哪些 数据 源 用 怎样 的 转换 逻辑 转换 成 数据 仓库 中 的 哪些 目的 数据 等 
内 容 描 述 出 来 。 这 样 ， 当 从 数据 仓库 向 数据 库 回溯 时 ， 便 能 够 根据 数据 变换 的 历史 ， 找 到 原始 
依据 。 数 据 仓库 的 元 数据 还 要 将 这 种 转换 管理 起 来 ， 既 保证 这 种 转换 是 正确 的 、 适 当 的 或 合理 
的 ， 又 要 使 其 是 可 变 的 、 灵 活 的 。 事 实 上 ， 因 为 用 户 需求 是 不 确定 的 ， 只 有 保证 元 数据 的 灵活 
性 、 可 变性 ， 才 能 真正 保证 其 合理 性 和 正确 性 。 

(3) 除了 描述 和 管理 从 数据 库 到 数据 仓库 的 转换 外 ， 数 据 仓 库 的 元 数据 当然 还 要 管理 好 数 
据 仓库 中 的 数据 。 一 方面 ， 数 据 仓库 中 的 数据 量 很 大 ， 划 分 不 同 的 粒度 层次 、 进 行 分 割 策略 的 
选择 、 建 立 各 种 各 样 的 索引 等 ， 都 需要 在 元 数据 中 进行 描述 和 管理 ; 另 一 方面 ， 数 据 仓库 中 包 
含 着 较 长 时 期 内 的 数据 ， 不 同时 期 不 同 的 需求 使 得 其 数据 从 形式 到 内 容 都 可 能 不 同 。 

元 数据 的 内 容 在 数据 仓库 设计 、 开 发 、 实 施 ， 以 及 使 用 过 程 中 不 断 完善 ， 不 仅 为 数据 仓库 
的 创建 提供 必要 的 信息 、 描 述 和 定义 ， 还 为 决策 支持 系统 分 析 人 员 访 问 数 据 仓库 提供 直接 的 或 
辅助 的 信息 。 


12.5.3 ”数据 转移 技术 


数据 仓库 的 基本 观念 之 一 是 ， 当 数据 从 业务 系统 或 其 他 数据 来 源 提取 出 来 时 ， 应 该 先 经 过 
变换 或 清洗 ， 才 能 将 它 加 载 到 数据 仓库 中 。 然 而 ， 对 于 数据 转移 的 目的 和 实现 转移 的 最 优 方法 
却 存在 很 多 混乱 的 看 法 。 在 数据 仓库 环境 中 进行 数据 转移 的 目的 应 该 有 两 个 : 第 一 ， 改 进 数据 
仓库 中 数据 的 质量 ， 第 二 提高 数据 仓库 中 数据 的 可 用 性 。 

所 谓 数据 转移 ， 也 称 为 数据 转换 或 数据 变换 ， 就 是 把 多 种 传统 资源 或 外 部 资源 信息 中 不 完 
善 的 数据 自动 转换 为 商务 中 准确 可 靠 的 数据 。 为 了 便于 讨论 ， 我 将 把 业务 数据 加 载 到 数据 仓库 
之 前 经 历 的 内 存 和 结构 的 变化 都 纳入 数据 转移 。 

在 建立 数据 仓库 的 过 程 中 ， 数 据 转移 是 个 重要 的 步 又。 实施 数据 转移 的 好 方法 有 很 多 ， 既 
有 定制 代码 的 程序 ， 也 有 用 于 转移 仓库 数据 的 专门 工具 。 无 论 采用 什么 方法 ， 转 移 的 几 个 基本 
方面 是 必须 实现 的 。 转 移 远 远 不 止 是 在 你 把 数据 移入 数据 仓库 时 改变 它 的 数据 结构 ， 真 正好 的 
转移 在 数据 进入 数据 仓库 时 能 够 检验 并 提高 它 的 质量 和 可 用 性 。 

为 了 对 数据 转移 的 复杂 性 进行 深入 的 讨论 ， 我 们 必须 定义 数据 转移 的 几 个 基本 类 型 。 每 一 
类 都 有 自己 的 特点 和 表现 形式 。 为 了 便于 讨论 ， 应 该 考虑 以 下 四 种 转移 类 型 。 

(1) 简单 转移 。 简 单 转移 是 所 有 数据 转移 的 基本 构成 单元 。 这 一 类 中 包括 的 数据 处 理 一 次 
只 针对 一 个 字段 ， 而 不 考虑 相关 字段 的 值 。 

(2) 清洗 。 清 洗 的 目的 是 为 了 保证 前 后 一 致 的 格式 化 和 使 用 某 一 字段 或 相关 的 字段 群 。 例 
如 ， 它 可 以 包括 地 址 信息 的 适当 格式 化 。 清 洗 还 能 检查 某 一 特定 字段 的 有 效 值 ， 通 常 是 通过 进 
行 范围 检查 或 是 从 枚 举 清单 中 做 出 选择 。 
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(3) 集成 。 集 成 是 指 将 业务 数据 从 一 个 或 几 个 来 源 中 取出 ， 并 逐 字 段 地 将 数据 映射 到 数据 
仓库 的 新 数据 结构 上 。 

(4) 聚集 和 概括 。 聚 集 和 概括 是 把 业务 环境 中 找到 的 零星 数据 压缩 成 仓库 环境 中 的 较 少数 
据 块 。 有 时 对 细节 数据 进行 聚集 是 为 了 避免 仓库 存 入 业务 环境 中 那样 具体 的 数据 ， 有 时 则 是 为 
了 建立 包括 仓库 的 聚集 副本 或 概括 副本 的 数据 商场 。 

顾名思义 ， 简 单 转移 代表 了 数据 转移 中 最 简单 的 形式 。 这 些 转移 一 次 改变 一 个 数据 属性 而 
不 考虑 该 属性 的 背景 或 与 它 相 关 的 其 他 信息 。 简 单 转移 有 如 下 形式 。 

(1) 数据 类 型 转换 。 最 常见 的 简单 变换 是 转换 一 个 数据 元 的 类 型 。 除 了 将 一 个 空 值 改 为 空 
白 或 零 之 外 〈 或 反之 )， 通 常 不 必 改 变 该 数据 元 的 语义 值 就 可 以 完成 一 次 简单 的 数据 类 型 转换 。 
当 应 用 程序 存储 的 某 个 类 型 的 数据 只 在 该 应 用 程序 的 背景 下 才 有 意义 ， 在 企业 水 平 上 却 没有 意 
义 时 ， 就 常常 要 求 进行 这 类 变换 。 这 类 转换 可 以 通过 编码 程序 中 的 简单 程序 完成 ， 或 者 运用 数 
据 仓库 数据 转换 工具 完成 。 所 有 转换 工具 都 能 轻松 、 迅 速 完成 这 类 简单 转换 。 另 外 ， 许 多 简单 
变换 可 以 通过 数据 库 卸 载 或 加 载 设施 完成 ， 这 种 设施 可 以 在 从 平面 文件 中 取出 数据 并 加 载 到 数 
据 库 中 时 进行 简单 数据 类 型 转换 。 

(2) 日 期 时 间 格 式 的 转换 。 一 般 而 言 ， 在 设计 和 构造 业务 应 用 程序 时 ,对 各 程序 内 日 期 /时 间 很 
少 进行 统一 的 处 理 。 应 用 程序 设计 人 员 常 常 选 择 用 最 适合 的 包含 业务 数据 的 数据 库 管理 系统 的 
格式 表示 日 期 和 时 间 。 在 某 些 情况 下 ， 甚 至 在 同一 应 用 程序 内 日 期 和 时 间 的 处 理 也 不 一 致 。 程 
序 模块 的 设计 者 按照 他 们 认为 合适 的 方式 随意 设计 日 期 和 时 间 字 段 ， 很 少 考虑 到 一 致 性 。 在 处 
理 业务 系统 中 时 间 和 日 期 的 格式 差异 的 背后 ， 无 论 有 什么 原因 ， 有 一 件 事 是 清楚 的 ， 数据 仓库 
必须 用 单一 的 模式 识别 日 期 及 时 间 信 息 。 正 如 2000 年 问题 所 显示 的 ， 我 们 必须 用 稳健 的 方式 
存 入 日 期 ， 包 括 完整 的 年 份 。 选 择 日 期 和 时 间 的 实际 物理 表示 法 决定 于 许多 因素 ， 但 无 论 选择 
了 哪 种 表示 方式 ， 它 都 应 该 存 入 年 份 的 四 个 数字 ， 必 须 在 整个 数据 仓库 中 一 致 地 使 用 它 。 

(3) 字段 解码 。 最 后 一 类 简单 变换 是 编码 字段 的 解码 。 简 单 地 说 ， 数 据 一 般 不 应 该 以 编码 
的 格式 存放 在 数据 仓库 中 。 我 们 在 业务 数据 库 中 建立 代码 是 为 了 节省 数据 库存 储 空间 。 虽 然 人 
不 理解 这 些 代码 , 但 这 并 不 是 个 大 问题 , 因为 我 们 与 那些 代码 的 交互 作用 是 由 应 用 程序 管理 的 ， 
这 些 程序 在 必要 的 时 候 会 为 我 们 破解 那些 值 的 代码 。 在 数据 仓库 环境 中 ， 情 况 就 大 不 一 样 了 。 
因为 有 些 查询 工具 能 破解 数据 库 值 ， 所 以 无 法 保证 应 用 程序 逻辑 一 定 能 将 用 户 与 数据 仓库 数据 
库 中 的 编码 值 隔绝 开 。 考 虑 到 查询 工具 的 不 断 增加 以 及 大 多 数 数据 仓库 的 用 户 自己 编写 查询 
时 ， 情 况 确实 如 此 。 当 他 们 编写 或 运行 特别 查询 时 ， 用 户 将 看 到 的 信息 就 像 存储 在 数据 库 中 一 
样 。 因 为 用 户 可 能 来 自 公司 的 任何 部 门 ， 所 以 数据 仓库 的 所 有 用 户 不 可 能 都 有 足够 的 背景 知识 
和 培训 ， 使 他 们 能 够 理解 在 业务 数据 库 中 使 用 的 编码 值 。 因 此 ， 业 务 系统 和 外 部 数据 中 的 编码 
值 在 存 入 数据 仓库 之 前 ， 应 该 转换 为 经 过 解码 的 、 易 于 理解 的 相应 值 。 当 然 ， 这 样 做 必须 遵循 
正确 的 路 线 。 一 方面 ， 我 们 想 把 编码 值 充分 扩展 ， 使 它们 为 最 大 多 数 的 用 户 理解 ， 另 一 方面 ， 


瑟 
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展 得 太 多 要 占用 额外 的 存储 空间 ， 而 且 把 该 值 当 作 查 询 中 的 检索 标准 也 很 困难 。 还 
用 户 对 于 数据 元 业务 含义 的 熟悉 程度 。 从 技术 角度 看 ， 字 段 解码 是 一 个 非常 易于 实 


现 的 过 程 。 它 可 以 很 容易 地 结合 到 转移 程序 中 去 , 也 可 以 在 数据 转移 工具 中 轻松 地 完成 。 然 而 ， 
确定 应 该 进行 多 少 解码 工作 是 很 难 的 。 

清洗 指 的 是 比 简单 变换 更 复杂 的 一 种 数据 转移 。 在 这 种 转移 中 ， 要 检查 的 是 字段 或 字段 组 
的 实际 内 容 而 不 仅 是 存储 格式 。 


一 种 清洗 是 检查 数据 字段 中 


这 里 给 出 了 每 种 方法 的 例子 。 
范围 检验 是 数据 清洗 的 最 简单 形式 。 它 是 指 检验 一 个 字段 中 的 数据 以 保证 它 落 在 预期 范围 
之 内 ， 通 常 是 数字 范围 或 日 期 范围 。 例 如 ， 可 以 检验 一 个 发 票 编号 ， 看 它 是 否 是 有 效 的 发 票 编 


号 ， 即 编号 是 否 介 了 
1 日 (公司 开业 之 日 ) 和 当前 日 期 之 间 ， 任 何 日 期 在 该 范 


的 有 效 值 。 这 可 以 通过 范围 检验 、 枚 举 清单 和 相关 检验 来 完成 。 


F 1000 和 99 999 之 间 ; 或 者 可 以 检验 发 票 日 期 ， 看 它 是 否 落 在 2005 年 4 月 
围 之 外 的 发 票 都 应 该 剔除 出 去 。 


枚 举 清单 也 相对 容易 实现 。 这 种 方法 是 对 照 数据 字段 可 接受 值 的 清单 检验 该 字段 的 值 。 例 
如 ， 可 以 检验 一 下 送 货 类 型 代码 ， 看 看 它 是 否 包括 有 效 值 “ 快 递 ”或 “普通 ”之 中 的 一 个 ， 任 
何 与 这 张 清单 不 符 的 值 将 被 剔除 出 去 以 待 进一步 调查 。 


相关 检验 稍微 复杂 一 些 ， 因 为 它 要 求 将 一 个 字段 中 的 值 与 男 一 个 字段 9 


FP 的 值 进 行 对 比 。 例 


如 , 我 们 可 以 检验 发 票 记录 上 的 采购 订货 编号 字段 , 看 看 它 是 不 是 我 们 系统 中 存在 的 采购 订货 。 
任何 含有 采购 订货 编号 却 没有 相应 采购 订货 的 发 票 记录 应 该 留待 进一步 调查 。 
数据 清洗 的 另 一 主要 类 型 是 重新 格式 化 某 些 类 型 的 数据 。 这 种 方法 适用 于 可 以 用 许多 不 同 


方式 存储 在 不 同 数据 来 源 中 


的 信息 ， 必 须 在 数据 仓库 中 把 这 类 信息 转换 成 一 种 统一 的 表示 方 


式 。 最 需要 格式 化 的 信息 之 一 是 地 址 信息 。 由 于 没有 一 种 获取 地 址 的 标准 方式 ， 所 以 同一 个 地 


址 可 以 用 许多 不 同方 式 表 示 出 来 。 当然 , 当 人 读 这 些 地 址 时 ， 他 们 能 认 出 它们 指 的 是 同一 地 点 。 
但 在 数据 仓库 中 ， 地 址 可 能 按 不 同方 式 存储 起 来 ， 那 种 对 应 关系 就 丢失 了 。 
址 转变 成 一 种 共同 的 格式 ， 这 样 我 们 才能 在 数据 仓库 中 确定 哪些 地 址 其 实 是 相同 的 。 

集成 是 要 把 从 全 然 不 同 的 数据 源 中 得 到 的 业务 数据 结合 在 一 起 , 困难 在 于 将 它们 集成 为 一 个 


紧密 结合 的 数据 模型 。 这 是 


因此 我 们 必须 把 地 


因为 数据 必须 从 多 个 数据 源 中 提取 出 来 ， 并 结合 成 为 一 个 新 的 实体 。 


这 些 数据 来 源 往往 遵守 的 不 是 同一 套 业务 规则 ， 在 生成 新 数据 时 ， 必 须 考虑 到 这 一 差异 。 因 为 不 
可 能 识别 出 每 种 可 能 发 生 的 集成 ， 所 以 这 里 只 讨论 字段 水 平 的 简单 映射 。 
字段 水 平 的 简单 映射 在 必须 执行 的 数据 转移 总 量 中 占 去 了 大 部 分 。 在 一 个 典型 的 数据 仓库 


个 字段 被 转移 到 目标 数据 字段 
个 字段 转移 到 数据 仓库 的 数据 结构 中 。 在 此 过 程 


里 ， 指 定 进行 的 转移 中 有 80% 一 90% 是 字段 水 平 的 简单 映射 。 这 种 映射 的 定义 是 指数 据 中 的 一 
的 过 程 ， 例 如 从 一 个 业务 数据 库 中 得 到 的 一 条 记录 ， 把 它 的 一 
Fh， 这 个 字段 可 以 利用 前 面 讨论 过 的 任何 一 种 


简单 变换 进行 变换 。 这 些 字段 水 平 的 映射 很 容易 实现 ， 并 且 占 了 数据 集成 工作 的 大 部 分 。 
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大 多 数 数据 仓库 都 要 用 到 数据 的 某 种 聚集 和 概括 。 这 通常 有 助 于 将 某 一 实体 的 实例 数目 减 
少 到 易于 驾驭 的 水 平 ， 也 有 助 于 预先 计算 出 广泛 应 用 的 统计 概括 数字 ， 以 使 每 个 查询 不 必 计 算 
它们 。 虽 然 聚 集 和 概括 往往 被 当 作 可 以 互 换 的 名 词 来 使 用 ， 但 在 数据 仓库 中 ， 这 两 个 名 词 的 含 
义 还 是 有 一 些 差异 的 。 概 括 是 指 按照 一 个 或 几 个 业务 维 将 相近 的 数值 加 在 一 起 ， 例 如 商店 把 每 
的 销售 额 加 在 一 起 ， 生 成 按 地 区 计算 的 月 销售 额 。 聚 集 指 将 不 同业 务 元 素 加 在 一 起 成 为 一 个 
共 总 数 。 但 是 为 了 便于 讨论 ， 我 们 不 区 分 聚集 和 概括 ， 在 数据 仓库 它们 是 以 相同 的 方式 进 
的 
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有 时 , 数据 仓库 中 存放 的 具体 数据 的 具体 程度 往往 不 如 业务 系统 中 存放 的 细节 数据 。 这 时 ， 
就 有 必要 在 变换 业务 数据 的 过 程 中 加 入 一 些 数据 聚集 功能 。 这 可 以 减少 存储 在 数据 仓库 中 的 行 
数 。 有 时 ， 聚 集 也 可 以 用 于 建立 数据 商场 ， 这 类 数据 商场 是 从 仓库 中 存储 的 更 具体 的 数据 中 衍 
生出 来 的 。 聚 集 的 第 三 个 作用 是 去 除数 据 仓 库 中 的 过 时 细节 。 在 许多 情况 下 ， 数 据 在 一 定时 期 
内 要 以 很 具体 的 水 平 存放 着 。 一 旦 数据 到 达 某 一 时 限 ， 对 这 些 细节 的 需求 就 大 大 减弱 了 。 此 时 
这 些 非 常 具体 的 数据 应 该 传送 到 存储 器 中 ， 而 数据 的 概括 形式 则 可 以 存放 在 数据 仓库 当中 。 

当然 ， 对 于 各 种 细节 数据 ， 有 许多 种 概括 方法 ， 每 一 种 概括 或 聚集 都 可 以 在 某 一 个 或 几 个 
维 进行 。 例 如 ， 一 家 零售 组 织 保存 着 每 次 单个 销售 事务 的 事务 处 理 数据 。 以 这 一 细节 数据 为 基 
础 ， 可 以 从 许多 维 进行 概括 。 例 如 产品 大 类 、 销 售 事务 类 型 、 地 理 区 域 、 顾 客 和 时 间 期 限 。 生 
成 的 每 一 个 总 和 都 是 在 一 个 或 几 个 维 上 进行 聚集 的 结果 。 这 样 ， 用 户 通过 访问 元 数据 ， 就 能 够 
得 知 每 种 概括 数据 的 衍生 方法 ， 这 一 点 是 极为 重要 的 ， 这 样 他 们 才能 知道 哪些 维 已 经 得 到 了 概 
括 以 及 概括 的 程度 。 

目前 可 以 得 到 的 数据 清洗 工具 ， 许 多 都 已 内 置 了 概括 功能 ， 尤 其 是 在 时 间 维 上 进行 聚集 的 
功能 。 当 然 ， 通 过 使 用 分 类 设施 就 可 以 轻松 地 做 到 这 一 点 ， 这 类 设施 中 含有 包括 复杂 的 概括 罗 
辑 能 力 。 不 管 如 何 做 到 这 一 点 ， 重 要 的 是 用 户 能 够 轻松 地 访问 元 数据 ， 了 解 生成 总 和 数据 所 用 
的 标准 。 
在 数据 仓库 环境 中 ， 实 现 数据 转移 的 方法 当然 不 止 一 种 。 但 最 主要 的 是 选择 转移 方式 ， 是 
使 用 为 数据 仓库 提供 数据 的 专用 数据 转移 工具 ， 还 是 建立 能 实现 转换 逻辑 的 手工 编制 程序 。 哪 
一 个 才 是 最 佳 选 择 要 决定 于 很 多 因素 ， 包 括 : 
(1) 时 间 范 围 。 虽 然 使 用 数据 转移 工具 能 大 大 方便 建立 和 维护 数据 仓库 的 过 程 ， 但 获取 、 
配置 和 学 习 这 些 工 具 都 要 花 些 时 间 。 如 果 生 产 第 一 个 仓库 应 交付 成 果 的 时 间 约束 很 紧 ， 那 么 这 
样 的 项 目 往 往 选择 人 工 编码 ， 在 仓库 建设 得 较 完 善 、 项 目 小 组 的 可 信 度 较 高 时 再 迁移 到 数据 转 
移 工具 中 。 

(2) 预算 。 数 据 仓库 工具 可 能 会 很 贵 ， 但 编程 人 员 编写 变换 程序 的 时 间 也 一 样 宝贵 ， 因 此 
最 佳 选 择 取决 于 哪 类 预算 近期 在 组 织 中 更 容易 得 到 。 但 从 长 期 来 看 ， 投 资 可 以 比 手工 编制 和 维 
护 变换 程序 的 成 本 要 节省 得 多 。 
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(3) 数据 仓库 的 规模 。 范 围 很 小 的 数据 仓库 〈 即 数据 源 很 少 ， 要 实现 的 转移 也 很 少 ) 可 能 
无 法 证 实 使 用 数据 转移 工具 的 成 本 合理 性 。 然 而 ， 当 数据 仓库 的 范围 逐渐 扩大 时 ， 维 护 手工 编 
写 的 变换 程序 将 变 得 越 来 越 困 难 ， 工 具 就 会 发 挥 更 大 的 作用 。 但 对 于 一 个 规模 很 小 的 初始 数据 
仓库 来 说 ， 当 然 就 不 需要 变换 工具 了 。 

(4) 数据 仓库 项 目 小 组 的 规模 和 技能 。 如 果 仓 库 小 组 足够 大 ， 而 且 具 有 适当 的 编程 技巧 ， 
建立 和 维护 转移 逻辑 就 容易 一 些 。 但 是 大 多 数 数据 仓库 小 组 都 受到 资源 的 限制 ， 无 法 得 到 足够 
的 开发 时 间 维护 所 有 的 变换 代码 。 因 此 他 们 发 现 转移 工具 特别 有 用 ， 因 为 数据 仓库 分 析 人 员 可 
以 不 要 编程 人 员 的 帮助 自己 建立 并 维护 大 多 数 的 转移 。 
当然 ， 使 用 数据 转移 工具 的 最 主要 原因 之 一 与 节省 时 间 和 有 效 利用 成 本 没有 太 大 的 关系 。 
这 个 原因 是 ， 好 的 数据 转移 工具 能 自动 地 生成 并 维护 宝贵 的 元 数据 。 


12.5.4 ”联机 分 析 处 理 ( OLAP ) 


20 世纪 年 代 末 ，E.F.Codd 所 提出 的 关系 数据 模型 促进 了 关系 数据 库 及 联机 事务 处 理 
(On-Line Transaction Processing，OLTP) 的 发 展 。 数 据 不 再 以 文件 方式 同 应 用 程序 捆绑 在 一 起 ， 
而 是 分 离 出 来 以 关系 表 方 式 供 大 家 共享 。 随 着 政府 及 商业 应 用 的 发 展 ， 数 据 量 越 来 越 大 ， 同 时 
用 户 的 查询 需求 也 越 来 越 复杂 ， 涉 及 的 已 不 仅 是 查询 或 操纵 一 张 关 系 表 中 的 一 条 或 几 条 记录 ， 
而 且 要 对 多 张 表 中 千 万 条 记录 进行 数据 分 析 和 信息 综合 。 关 系数 据 库 系统 已 不 能 全 部 满足 这 一 
要 求 。 这 两 类 应 用 ， 操 作 型 应 用 和 分 析 型 应 用 ,特别 是 在 性 能 上 难以 两 全 ， 尽 管 为 了 提高 性 能 ， 
人 们 常常 在 关系 数据 库 中 放宽 了 对 宛 余 的 限制 ， 引 入 了 统计 及 综合 数据 ， 但 这 些 统计 综合 数据 
的 应 用 逻辑 却 是 分 散 杂 乱 的 ， 非 系统 化 的 ， 因 此 分 析 功能 有 限 、 不 灵活 ， 维 护 困难 。 在 国外 ， 
不 少 软件 厂商 采取 了 发 展 其 前 端 产品 来 弥补 关系 数据 库 管理 系统 支持 的 不 足 ， 他 们 通过 专门 的 
数据 综合 引擎 ， 辅 之 以 更 加 直观 的 数据 访问 界面 ， 力 图 统一 分 散 的 公共 应 用 逻辑 ， 在 短 时 间 内 
响应 非 数据 处 理 专业 人 员 的 复杂 查询 要 求 。1993 年 ，Codd 将 这 类 技术 定义 为 联机 分 析 处 理 
(On-Line Analytical Processing，OLAP)。OLAP 作为 一 类 产品 同 OLTP 明显 区 分 开 来 。 

OLAP 是 针对 特定 问题 的 联机 数据 访问 和 分 析 。 为 了 反映 用 户 所 能 理解 的 企业 的 真实 的 
“ 维 ”， 原 始 的 数据 被 进行 了 转换 ， 从 而 形成 了 可 用 的 信息 。 通 过 对 信息 的 很 多 种 可 能 的 观察 形 
式 进行 快速 、 稳 定 一 致 的 交互 性 存 取 ， 人 允许 管理 决策 人 员 对 数据 进行 深入 观察 。 

OLAP 是 以 数据 仓库 进行 分 析 决 策 的 基础 ， 针 对 特定 问题 的 联机 数据 访问 和 分 析 ，OLAP 
E 够 对 不 同 数据 集合 进行 基于 某 个 或 是 多 个 角度 的 比较 ， 它 能 够 从 不 同 角度 切割 数据 集合 从 而 
进行 分 析 。 从 某 种 意义 来 说 ，OLAP 是 有 预见 性 的 。OLAP 的 分 析 是 建立 在 经 验 的 基础 上 ， 对 
数据 进行 某 种 指定 关联 的 分 析 。 在 联机 事务 处 理 系统 中 ， 由 于 数据 的 离散 性 ， 而 使 OLAP 实现 
起 来 相当 复杂 甚至 是 不 可 能 ， 而 以 数据 仓库 为 依托 ， 辅 之 以 OLAP 工具 ，OLAP 的 实现 将 十 分 
简单 易 行 。 
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OLAP 中 的 基本 概念 如 下 。 

(1) 变量 : 变量 是 数据 的 实际 意义 ， 即 描述 数据 “是 什么 ”。 例如: 数据 “10 000” 本 身 并 

没有 意义 或 者 说 意义 未 定 ， 它 可 能 是 一 个 学 校 的 学 生 人 数 ， 也 可 能 是 某 产 品 的 单价 ， 还 可 能 是 
某 商 品 的 销售 量 等 等 。 一 般 情况 下 ， 变 量 总 是 一 个 数值 度量 指标 ， 例 如 :“ 人 数 ”“ 单 价 ”“ 销 
售 量 ”等 都 是 变量 ， 而 “10 000” 则 是 变量 的 一 个 值 。 
(2) 维 : 维 是 人 们 观察 数据 的 特定 角度 。 例 如 ， 企 业 常常 关心 产品 销售 数据 随 着 时 间 推 移 
而 产生 的 变化 情况 ， 这 时 他 是 从 时 间 的 角度 来 观察 产品 的 销售 ， 所 以 时 间 就 是 一 个 维 ， 简 称 为 
时 间 维 。 企 业 也 时 常 关 心 自己 的 产品 在 不 同 地 区 的 销售 分 布 情况 ， 这 时 他 是 从 地 理 分 布 的 角度 
来 观察 产品 的 销售 ， 所 以 地 理 分 布 也 是 一 个 维 ， 称 为 地 理 维 。 

(3) 维 的 层次 : 人 们 观察 数据 的 某 个 特定 角度 〈 即 某 个 维 ) 还 可 以 存在 细节 程度 不 同 的 多 
个 描述 方面 , 我 们 称 这 多 个 描述 方面 为 维 的 层次 。 一 个 维 往往 具有 多 个 层次 , 例如 描述 时 间 维 ， 
可 以 从 日 期 、 月份、 季度 、 年 等 不 同 层次 来 描述 ， 那 么 日 期 、 月 份 、 季 度 、 年 等 就 是 时 间 维 的 
层次 ; 同样 ， 城 市 、 地 区 、 国 家 等 构成 了 一 个 地 理 维 的 多 个 层次 。 

(4) 维 成 员 : 维 的 一 个 取 值 称 为 该 维 的 一 个 维 成 员 。 如 果 一 个 维 是 多 层次 的 ， 那 么 该 维 的 
维 成 员 是 在 不 同 维 层次 的 取 值 的 组 合 。 例如, 我 们 考虑 时 间 维 具有 日 期 、 月 份 、 年 这 三 个 层次 ， 
分 别 在 日 期 、 月份 、 年 上 各 取 一 个 值 组 合 起 来 ， 就 得 到 了 时 间 维 的 一 个 维 成 员 ， 即 “ 某 年 某 月 
某 日 ”。 一 个 维 成 员 并 不 一 定 在 每 个 维 层 次 上 都 要 取 值 , 例如 ,“ 某 年 某 月 ”“ 某 月 某 日 "“ 某 年 ” 
等 等 都 是 时 间 维 的 维 成 员 。 对 应 一 个 数据 项 来 说 ， 维 成 员 是 该 数据 项 在 某 维 中 位 置 的 描述 。 例 
如 对 一 个 销售 数据 来 说 ， 时 间 维 的 维 成 员 “ 某 年 某 月 某 日 ”就 表示 该 销售 数据 是 “ 某 年 某 月 某 
日 ”的 销售 数据 ,“ 某 年 某 月 某 日 ”是 该 销售 数据 在 时 间 维 上 位 置 的 描述 。 

(5) 多 维 数组 :一 个 多 维 数组 可 以 表示 为 :( 维 1， 维 2，…… ， 维 n， 变 量 )。 例 如 ，( 地 
区 ， 时 间 ， 销 售 渠道 ， 销 售 额 ) 就 是 一 个 多 维 数组 ， 其 中 销售 额 是 变量 ， 它 定义 在 地 区 维 、 时 
间 维 和 销售 渠道 维 这 二 者 的 基础 上 。 

(6) 数据 单元 ， 多 维 数组 的 取 值 称 为 数据 单元 。 当 在 多 维 数组 的 各 个 维 中 都 选中 一 个 维 成 
员 ， 这 些 维 成 员 的 组 合 就 唯一 确定 了 一 个 变量 的 值 。 那 么 数据 单元 就 可 以 表示 为 : ( 维 1 的 维 
成 员 ， 维 2 的 维 成 员 ，…… ， 维 n 的 维 成 员 ， 变 量 的 值 )。 

多 维 分 析 是 指 对 以 多 维 形式 组 织 起 来 的 数据 采取 切片 、 切 抉 、 施 转 等 各 种 分 析 动 作 ， 以 求 
剖析 数据 ， 使 最 终 用 户 能 从 多 个 角度 、 多 侧面 地 观察 数据 库 中 的 数据 ， 从 而 深入 地 了 解 包含 在 
数据 中 的 信息 、 内 涵 。 多 维 分 析 方 式 迎合 了 人 的 思维 模式 ， 因 此 减少 了 混淆 并 且 降 低 了 出 现 错 
误解 释 的 可 能 性 。 多 维 分 析 的 基本 动作 如 下 。 

(1) 切片 : 在 多 维 数组 的 某 一 维 上 选 定 一 维 成 员 的 动作 称 为 切片 ， 即 在 多 维 数组 〈 维 1， 
维 2，…… ， 维 n， 变 量 ) 中 选 一 维 ， 并 取 其 一 维 成 员 。 

(2) 切 块 : 在 多 维 数组 的 某 一 维 上 选 定 某 一 区 间 的 维 成 员 的 动作 称 为 切 块 ， 即 限制 多 维 数 
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组 的 某 一 维 的 取 值 区 间 。 显 然 ， 当 这 一 区 间 只 取 一 个 维 成 员 时 ， 即 得 到 一 个 切片 。 

(3) 旋转 : 旋转 即 是 改变 一 个 报告 或 页 面 显 示 的 维 方向 。 例 如 ， 旋 转 可 能 包含 了 交换 行 和 
列 ， 或 是 把 某 一 个 行 维 移 到 列 维 中 去 ， 或 是 把 页 面 显示 中 的 一 个 维和 页 面 外 的 维 进行 交换 〈 令 
其 成 为 新 的 行 或 列 中 的 一 个 )。 

OLAP 的 数据 来 源 于 数据 库 。 通过 OLAP 服务 器 , 将 这 些 数据 抽取 和 转换 为 多 维 数据 结构 ， 
以 反映 用 户 能 理解 的 企业 的 真实 维 。 通过 多 维 分 析 工 具 对 信息 的 多 个 角度 、 多 个 侧面 进行 快速 、 
一 致 和 交互 的 存 取 ， 从 而 使 分 析 员 、 经 理 和 行政 人 员 能 够 对 数据 进行 深入 的 分 析 和 观察 。 

在 数据 仓库 系统 中 OLAP 使 用 的 多 维 数据 可 以 位 于 不 同 的 层次 , 可 以 作为 数据 仓库 的 一 部 
分 ， 也 可 以 作为 数据 仓库 工具 层 的 一 部 分 。 由 于 所 处 的 层次 的 不 同 ， 其 分 析 结 果 的 综合 程度 也 
相应 有 高 低 之 分 ， 所 以 可 以 满足 具有 不 同 应 用 需求 用 户 的 要 求 。 

1993 年 ，Codd 提出 了 有 关 OLAP 的 十 二 条 准则 ， 这 也 是 他 继 关 系数 据 库 和 分 布 式 数据 库 
提出 的 两 个 “十 二 条 准则 ”后 提出 的 第 三 个 “十 二 条 准则 ”尽管 业界 对 这 个 十 二 条 准则 褒贬 

一 ， 但 其 主要 方面 ， 如 多 维 数据 分 析 、 客 户 /服务 器 结构 、 多 用 户 支持 及 一 致 的 报表 性 能 等 得 

到 了 大 多 数 人 的 认可 。 

(1) OLAP 模型 必须 提供 多 维 概念 视图 : 从 用 户 分 析 员 的 角度 来 看 ， 整 个 企业 的 视图 在 本 
质 上 是 多 维 的 ， 因 此 OLAP 的 概念 模型 也 应 是 多 维 的 。 企 业 决 策 分 析 的 目的 不 同 ， 决 定 了 分 析 
和 衡量 企业 的 数据 总 是 从 不 同 的 角度 来 进行 的 ， 所 以 企业 数据 空间 本 身 就 是 多 维 的 。 

(2) 透明 性 准则 : 无 论 OLAP 是 否 是 前 端 产品 的 一 部 分 ， 对 用 户 来 说 ， 它 都 是 透明 的 。 久 
果 在 客户 /服务 器 结构 中 提供 OLAP 产品 ,那么 对 最 终 分 析 员 来 说 ， 它 同样 也 应 透明 。 透 明 性 原 
则 包括 两 层 含义 。 首 先 ，OLAP 在 体系 结构 中 的 位 置 对 用 户 是 透明 的 。OLAP 应 处 于 一 个 真正 
的 开放 系统 结构 中 ， 人 允许 分 析 工 具 媒 入 到 分 析 人 员 指 定 的 任何 位 置 而 不 影响 医 入 工具 的 性 能 ， 
这 对 保持 用 户 现 有 的 效率 ， 保 证 良好 的 性 能 至 关 重 要 。 同 时 必须 保证 OLAP 的 媒 入 不 会 引入 和 
增加 任何 复杂 性 。 其 次 ，OLAP 的 数据 源 对 用 户 也 是 透明 的 。 用 户 只 需 使 用 熟悉 的 查询 工具 进 
行 查询 ， 而 不 必 关 心 输入 OLAP 工具 的 数据 是 来 自 于 同 构 还 是 异 构 的 企业 数据 源 。 

(3) 存 取 能 力 准 则 : OLAP 系统 不 仅 能 进行 开放 的 存 取 , 而 且 还 提供 高 效 的 存 取 策略 。OLAP 
用 户 分 析 员 不 仅 能 在 公共 概念 视图 的 基础 上 对 关系 数据 库 中 的 企业 数据 进行 分 析 ， 而 且 在 公共 
分 析 模型 的 基础 上 还 可 以 对 关系 数据 库 、 非 关系 数据 库 和 外 部 存储 的 数据 进行 分 析 。OLAP 系 
统 应 提供 高 效 的 存 取 策略 ， 应 使 系统 只 存 取 与 指定 分 析 有 关 的 数据 ， 避 免 多 余 的 数据 存 取 。 

(4) 稳定 的 报表 性 能 : 当 数 据 的 维 数 和 综合 层次 增加 时 ， 提 供给 最 终 分 析 员 的 报表 能 力 和 
响应 速度 不 应 该 有 明显 的 降低 和 减 慢 ， 这 对 维护 OLAP 产品 的 易 用 性 和 低 复 杂 性 至 关 重 要 。 即 
便当 企业 模型 改变 时 ， 关 键 数 据 的 计算 方法 也 无 须 更 改 。 只 有 做 到 这 一 点 ，OLAP 工具 提供 的 
数据 报表 和 所 做 的 预测 分 析 结 果 才 是 可 信 的 。 

(5) 客户 /服务 器 体系 结构 : OLAP 是 建立 在 客户 /服务 器 体系 结构 上 的 。 这 要 求 它 的 多 维 数 
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据 库 服务 器 能 够 被 不 同 的 应 用 和 工具 访问 到 。 服 务 器 端 智 能 地 以 最 小 的 代价 完成 同 多 种 服务 器 
之 间 的 挂 接任 务 ， 服 务 器 端 必须 完成 分 散 的 企业 数据 库 的 逻辑 模式 和 物理 模式 之 间 的 映射 ， 并 
确保 它们 的 一 致 性 ， 从 而 保证 透明 性 和 建立 统一 的 公共 概念 模式 、 罗 辑 模式 和 物理 模式 。 客 户 
端 负责 应 用 逻辑 和 用 户 界 面 。 

(6) 维 的 等 同性 准则 : 每 一 数据 维 在 数据 结构 和 操作 能 力 上 都 是 等 同 的 。 系 统 可 以 将 附加 
的 操作 能 力 赋予 所 选 的 维 ， 但 必须 保证 该 操作 能 力 可 以 赋予 其 他 任意 的 维 ， 即 要 求 维 上 的 操作 
是 公共 的 。 

(7) 动态 的 稀 朴 矩阵 处 理 准则 : OLAP 工具 的 物理 模型 必须 充分 适应 指定 的 分 析 模型 ， 提 
供 “ 最 优 ” 的 稀疏 和 矩阵 处 理 ， 这 是 OLAP 工具 所 应 遵循 的 最 重要 的 准则 之 一 。 该 准则 包括 两 
含义 ;第 一 ， 对 任意 给 定 的 稀疏 矩阵 ， 存 在 且 仅 存 在 一 个 最 优 的 物理 视图 ， 它 能 提供 最 大 的 
存 效率 和 矩阵 处 理 能 力 。 稍 朴 度 是 数据 分 布 的 一 个 特征 ， 如 果 不 能 适应 数据 集合 的 数据 分 布 ， 
将 会 导致 快速 、 高 效 操作 的 失败 。 第 二 ，OLAP 工具 的 基本 物理 数据 单元 可 配置 给 可 能 出 现 的 
维 的 子 集 。 同 时 ， 还 要 提供 动态 可 变 的 访问 方法 并 包含 多 种 存 取 机 制 ， 使 得 访问 速度 不 会 因数 
据 维 的 多 少 、 数 据 集 的 大 小 而 变化 。 

(8) 多 用 户 支持 能 力 准 则 : 多 个 用 户 分 析 员 可 以 同时 工作 于 同一 分 析 模 型 上 ， 或 者 可 以 在 
同一 企业 数据 上 建立 不 同 的 分 析 模型 。 该 准则 可 由 准则 5 推出 。OLAP 工具 必须 提供 并 发 访问 、 
数据 完整 性 及 安全 性 机 制 。 实 际 上 ，OLAP 工具 必须 支持 多 用 户 也 是 为 了 适合 数据 分 析 工 作 的 
特点 。 我 们 推荐 以 工作 组 的 形式 来 使 用 OLAP 工具 ， 这 样 多 个 用 户 可 以 交换 各 自 的 想法 和 分 析 
结果 。 

(9) 不 受 限 的 跨 维 操作 : 多 维 数据 之 间 存 在 固有 的 层次 关系 ， 这 就 要 求 OLAP 工具 能 自己 
推导 出 而 不 是 由 最 终 用 户 明确 定义 出 相关 的 计算 。 对 于 无 法 从 固有 关系 中 得 出 的 计算 ， 要 求 系 
统 提供 计算 完备 的 语言 来 定义 各 类 计算 公式 。 该 准则 是 对 准则 1 的 一 个 补充 ， 对 操作 能 力 和 操 
作 范 围 做 出 了 要 求 。 

(10) 直观 的 数据 操纵 : 要 求 数据 操纵 直观 易 懂 。 综 合 路 径 重 定位 、 向 上 综合 、 向 下 挖掘 
和 其 他 操作 都 可 以 通过 直观 、 方 便 的 点 位 操作 完成 。 

(11) 灵活 的 报表 生成 : 报表 必须 从 各 种 可 能 的 方面 显示 出 从 数据 模型 中 综合 出 的 数据 和 
信息 ， 充 分 反映 数据 分 析 模 型 的 多 维特 征 。 

(12) 不 受 限制 的 维 数 与 聚集 层次 : OLAP 工具 的 维 数 应 不 小 于 15 维 ， 用 户 分 析 员 可 以 在 
任意 给 定 的 综合 路 径 上 建立 任意 多 个 聚集 层次 。 


12.5.5 ”联机 事务 处 理 (OLTP ) 


在 这 一 节 中 ， 我 们 将 联机 分 析 处 理 〈OLAP) 和 联机 事务 处 理 〈OLTP) 进行 分 析 和 比较 。 
OLAP 主要 是 关于 如 何 理解 聚集 的 大 量 不 同 的 数据 。 与 OLTP 应 用 程序 不 同 ，OLAP 包含 
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许多 具有 复杂 关系 的 数据 项 。OLAP 的 目的 就 是 分 析 这 些 数据 ， 寻 找 模式 、 趋 势 以 及 例外 情况 。 

OLAP 是 决策 人 员 和 高 层 管理 人 员 对 数据 仓库 进行 信息 分 析 处 理 。OLAP 数据 可 能 包含 以 
地 区 、 类 型 或 渠道 分 类 的 销售 数据 。 一 个 典型 的 OLAP 查询 可 能 要 访问 一 个 多 年 的 销售 数据 库 ， 
以 便 能 找到 在 每 一 个 地 区 的 每 一 种 产品 的 销售 情况 。 当 得 到 这 些 数据 后 ， 分 析 人 员 可 能 会 进 一 
步 地 细 化 查询 ， 在 以 地 区 、 产 品 分 类 的 情况 下 查询 每 一 个 销售 渠道 的 销售 量 。 最 后 ， 分 析 人 员 
可 能 会 针对 每 一 个 销售 渠道 进行 年 与 年 或 者 季度 与 季度 的 比较 。 整 个 过 程 必须 被 联机 执行 并 要 
有 快速 的 响应 时 间 ， 以 便 分 析 过 程 不 受 外 界 干扰 。 联 机 分 析 处 理 可 以 被 刻画 为 具有 下 面 特征 的 
联机 事务 。 

(1) 可 以 存 取 大 量 的 数据 ， 比 如 几 年 的 销售 数据 ， 分 析 各 个 商业 元 素 类 型 之 间 的 关系 ， 如 
销售 、 产 品 、 地 区 、 渠 道 。 

(2) 需要 包含 聚集 的 数据 ， 例 如 销售 量 、 预 算 金额 以 及 消费 金额 。 

(3) 按 层次 对 比 不 同时 间 周期 的 聚集 数据 ， 如 月 、 季 度 或 者 年 。 

(4) 以 不 同 的 方式 来 表现 数据 ， 如 以 地 区 、 或 者 每 一 地 区 内 按 不 同 销售 渠道 、 不 同 产品 来 
表现 。 

(5) 需要 包含 数据 元 素 之 间 的 复杂 计算 ， 如 在 某 一 地 区 的 每 一 销售 渠道 的 期 望 利润 与 销售 
收入 之 间 的 分 析 。 

(6) 能 够 快速 地 响应 用 户 的 查询 ， 以 便 用 户 的 分 析 思 考 过 程 不 受 系统 影响 。 

OLAP 服务 器 允许 用 熟悉 的 工具 方便 地 存 取 不 同 的 数据 源 。 快 速 响应 时 间 是 OLAP 中 的 关 
键 因 素 。 它 分 批 处 理 报表 ， 应 用 程序 中 的 信息 必须 快速 可 得 ， 以 便 执 行进 一 步 的 分 析 。 为 了 使 
分 析 过 程 变 得 容易 ，OLAP 应 用 程序 经 常 以 诸如 电子 表格 这 样 容 易 辨 识 的 形式 提交 数据 。 

OLTP 是 操作 人 员 和 低层 管理 人 员 利用 计算 机 网 络 对 数据 库 中 的 数据 进行 查询 、 增 加 、 删 
除 、 修 改 等 操作 ， 以 完成 事务 处 理工 作 。 

OLTP 以 快速 事务 响应 和 频繁 的 数据 修改 为 特征 ， 用 户 利用 数据 库 快 速 地 处 理 具体 业务 。 
OLTP 应 用 时 有 频繁 的 写 操作 ， 所 以 数据 库 要 提供 数据 锁 、 事 务 日 志 等 机 制 。OLTP 应 用 要 求 多 
个 查询 并 行 ， 以 便 将 每 个 查询 的 执行 分 布 到 一 个 处 理 器 上 。 

与 OLAP 应 用 程序 不 同 ，OLTP 应 用 程序 包含 大 量 相对 简单 的 事务 。 对 这 些 事务 通常 只 是 
需要 获取 或 更 新 其 中 的 一 小 部 分 数据 ， 且 这 些 表 之 间 的 关系 通常 是 很 简单 的 。 

现代 的 数据 库存 储 有 数 以 万 计 的 数据 ， 经 常 每 天 处 理 成 千 上 万 的 事务 ，OLTP 数据 库 在 查 
找 业 务 数据 时 是 非常 有 效 的 。 但 在 为 决策 者 提供 综合 汇总 性 数据 时 则 显得 力不从心 。 这 就 需要 
OLAP 技术 。OLAP 是 一 项 以 灵活 、 可 用 和 及 时 的 方式 构造 、 处 理 和 表示 综合 数据 的 技术 。 例 
如 ， 下 面 一 个 简单 的 问题 : 查看 1999 年 西南 地 区 的 销售 情况 ， 数 据 按 省 、 季 度 和 产品 分 类 。 
首先 要 从 OLTP 的 数据 库 中 抽取 数据 ， 这 需要 大 量 的 时 间 ; 然后 ， 还 要 用 大 量 的 时 间 来 查询 检 
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索 该 年 四 个 季度 每 个 月 的 销售 数据 等 。 而 用 OLAP 技术 则 可 以 在 几 秒 钟 内 完成 这 样 
OLTP 的 特点 在 


FE 于 事务 量 大 ， 但 事务 内 容 比较 简单 且 村 


数据 模型 采用 E-R 模型 。 


响 
响 


OLTP 处 理 的 数据 是 高 度 结构 化 的 ， 涉 及 的 事务 比较 简单 ， 因 
性 能 。 反 之 ， 决 策 支 持 系统 的 一 个 查询 可 能 涉及 数 万 条 记录 。 这 时 复杂 的 连接 操 { 
性 能 。 在 OLTP 系统 中 ， 数 据 访问 路 径 是 已 知 的 ， 至 少 是 相对 


相 适 应 ， 在 数据 组 织 方面 OLTP 以 应 用 为 核心 、 是 应 


此 OLTP 


固定 的 ， 应 


驱动 


的 问题 。 

在 复 率 高 。 大 量 的 数据 操作 主要 涉及 
的 是 一 些 增加 、 删 除 、 修 改 操作 ， 一 般 仅 仅 涉及 一 张 或 几 张 表 的 少数 记录 ， 
处 理 高 度 结构 化 的 信息 。 与 其 


适合 于 
汐 ， 


此 复杂 的 表 关 联 不 会 严重 影 


会 严重 影 
用 程序 可 以 在 事务 


中 使 用 具体 的 数据 结构 如 表 、 索 引 等 。 而 决策 支持 系统 使 用 的 数据 不 仅 有 结构 化 数据 ， 而 且 有 

非 结 构 化 数据 ， 用 户 常常 是 在 想 要 某 种 数据 前 才 决 定 去 分 析 该 数据 。 因 此 数据 仓库 系统 中 一 定 

要 为 用 户 设计 出 更 为 简明 的 数据 分 析 模 型 ， 这 样 才 能 为 决策 支持 提供 更 为 透明 的 数据 访问 。 
OLTP 和 OLAP 的 区 别 如 表 12-1 所 示 。 


表 12-1 OLTP 与 OLAP 对 比 表 


OLTP OLAP 

数据 库 原 始 数据 数据 库 导 出 数据 或 数据 仓库 数据 

细节 性 数据 综合 性 数据 

当前 数据 历史 数据 

经 常 更 新 不 可 更 新 ， 但 周期 性 刷新 

一 次 性 处 理 的 数据 量 小 一 次 性 处 理 的 数据 量 大 

响应 时 间 要 求 高 响应 时 间 合 理 

用 户 数量 大 用 户 数量 相对 较 少 

面向 操作 人 员 ， 支 持 日 常 操作 面向 决策 人 员 ， 支 持 管理 需要 

面向 应 用 ， 事 务 驱 动 面向 分 析 ， 分 析 驱 动 

表 12-1 可 见 ，OLTP 与 OLAP 是 两 类 不 同 的 应 用 。OLTP 面 对 的 是 操作 人 员 和 低层 管理 
人 员 ，OLAP 面 对 的 是 决策 人 员 和 高 层 管理 人 员 ; OLTP 是 对 基本 数据 的 查询 和 增加 、 删 除 、 
修改 操作 处 理 , 它 以 数据 库 为 基础 , 而 OLAP 更 适合 以 数据 仓库 为 基础 的 数据 分 析 处 理 。 
所 需 的 历史 的 、 导 出 的 及 经 综合 提炼 的 数据 均 来 自 OLTP 所 依赖 的 底层 数据 库 。OLAP 数据 较 


之 OLTP 数据 而 言 要 增加 数据 多 维 化 或 预 综 合 处 理 等 操作 。 例 
预 综合 处 理 ， 建 立 不 同 层次 级 别 的 统计 数据 ， 从 而 满足 快速 统计 分 析 和 查询 的 要 求 。 除 了 数据 
风格 及 数据 访问 方式 也 同 OLTP 有 所 区 别 .OLTP 


及 处 理 上 的 不 


同 之 外 , OLAP 的 前 端 产 品 的 界 画 


如 ， 对 一 些 统计 数据 ， 首 先进 


OLAP 


多 为 操作 人 员 经 常用 


到 的 


加 


日 


定 表格 ， 查 询 和 数据 显示 也 比较 


定 、 规 范 。 而 OLAP 多 采 


便于 
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非 数据 处 理 专业 人 员 理解 的 方式 ， 如 多 维 报表 、 统 计 图 形 等 ， 查 询 及 数据 输出 直观 灵活 ， 用 户 
可 以 方便 地 进行 逐 层 细 化 、 切 片 、 切 块 和 数据 旋转 等 操作 。 


12.6” 非 关系 型 数据 库 NoSQL 


NoSQL， 指 的 是 非 关系 型 的 数据 库 ， 有 时 也 被 认为 是 Not Only SQL 的 简写 ， 是 对 不 同 于 
传统 的 关系 型 数据 库 的 数据 库 管 理 系统 的 统称 。 两 者 存在 许多 显著 的 不 同 点 ， 其 中 最 重要 的 是 
NoSQL 不 使 用 SQL 作为 查询 语言 。 其 数据 存储 可 以 不 需要 固定 的 表格 模式 ， 也 经 常会 避免 使 
用 SQL 的 JOIN 操作 ， 一 般 有 水 平 可 扩展 性 的 特征 。 


12.6.1 NoSQL 概述 


随 着 互联 网 Web 2.0 网 站 的 兴起 ， 非 关系 型 的 数据 库 现在 成 了 一 个 极其 热门 的 新 领域 ， 非 
关系 数据 库 产品 的 发 展 非常 迅速 。 而 传统 的 关系 数据 库 在 应 付 Web 2.0 网 站 ， 特 别 是 超大 规模 
和 高 并 发 的 SNS (Social Network Site， 社 交 网 站 ) 类 型 的 Web 2.0 纯 动态 网 站 已 经 显得 力 不 从 
心 ， 暴 露 了 很 多 难以 克服 的 问题 ， 例 如 : 

1) 对 数据 库 高 并 发 读 写 的 需求 

Web 2.0 网 站 要 根据 用 户 个 性 化 信息 来 实时 生成 动态 页 面 和 提供 动态 信息 ， 所 以 基本 上 无 
法 使 用 动态 页 面 静态 化 技术 ， 因 此 数据 库 并 发 负载 非常 高 ， 往 往 要 达到 每 秒 上 万 次 读 写 请 求 。 
关系 数据 库 应 付 上 万 次 SQL 查询 还 勉强 项 得 住 ， 但 是 应 付 上 万 次 SQL 写 数据 请 求 ， 硬 盘 IO 
就 已 经 无 法 承受 了 。 对 于 普通 的 SNS 网 站 ， 往 往 存在 对 高 并 发 写 请 求 的 需求 。 

2) 对 海量 数据 的 高 效率 存储 和 访问 的 需求 

对 于 大 型 的 SNS 网 站 ， 每 天 用 户 产生 海量 的 用 户 动 态 ， 以 Facebook 为 例 ， 每 天 要 处 理 27 
亿 次 Like 按钮 点 击 ，3 亿 张 图 片上 传 ，500TB 数据 接收 。 对 于 关系 数据 库 来 说 ， 在 上 亿 条 记录 
的 表 里 面 进行 SQL 查询 ， 效 率 是 极其 低下 乃至 不 可 忍受 的 。 再 例如 大 型 Web 网 站 的 用 户 登 录 
系统 ， 例 如 腾讯 和 人 人 网 ， 动 辑 数 以 亿 计 的 账号 ， 关 系数 据 库 也 很 难 应 付 。 

3) 对 数据 库 的 高 可 扩展 性 和 高 可 用 性 的 需求 

在 基于 Web 的 架构 当中 , 数据 库 是 最 难 进行 横向 扩展 的 ， 当 一 个 应 用 系统 的 用 户 量 和 访问 
量 与 日 俱 增 的 时 候 , 你 的 数据 库 却 没有 办 法 像 Web Server 和 App Server 那样 简单 地 通过 添加 更 
多 的 硬件 和 服务 节点 来 扩展 性 能 和 负载 能 力 。 对 于 很 多 需要 提供 24 小 时 不 间断 服务 的 网 站 来 
说 ， 对 数据 库 系统 进行 升级 和 扩展 是 非常 痛苦 的 事情 ， 往 往 需要 停机 维护 和 数据 迁移 ， 为 什么 
数据 库 不 能 通过 不 断 地 添加 服务 器 节点 来 实现 扩展 呢 ? 

在 上 面 提 到 的 “三 高 ”需求 面前 ， 关 系数 据 库 遇 到 了 难以 克服 的 障碍 ， 而 对 于 Web 2.0 网 
站 来 说 ， 关 系数 据 库 的 很 多 主要 特性 却 往往 无 用 武之 地 ， 例 如 : 
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(1) 数据 库 事务 一 致 性 需求 。 很 多 Web 实 时 系统 并 不 要 求 严 格 的 数据 库 事务 ， 对 读 一 致 性 
的 要 求 很 低 ， 有 些 场合 对 写 一 致 性 要 求 也 不 高 。 因 此 数据 库 事务 管理 成 了 数据 库 高 负载 下 一 个 
沉重 的 负担 。 

(2) 数据 库 的 写实 时 性 和 读 实时 性 需求 。 对 关系 数据 库 来 说 , 插入 一 条 数据 之 后 立刻 查询 ， 
是 肯定 可 以 读 出 来 这 条 数据 的 ， 但 是 对 于 很 多 web 应 用 来 说 ， 并 不 要 求 这 么 高 的 实时 性 。 

(3) 对 复杂 的 SQL 查询 ， 特 别 是 多 表 关 联 查 询 的 需求 。 任 何 大 数据 量 的 Web 系统 ， 都 非 
常 忌讳 多 个 大 表 的 关联 查询 ， 以 及 复杂 的 数据 分 析 类 型 的 复杂 SQL 报表 查询 ， 特 别 是 SNS 类 
型 的 网 站 ， 从 需求 以 及 产品 设计 角度 ， 就 避免 了 这 种 情况 的 产生 。 往 往 更 多 的 只 是 单 表 的 主键 
查询 ， 以 及 单 表 的 简单 条 件 分 页 查询 ，SQL 的 功能 被 极 大 地 弱化 了 。 
因此 ， 关 系数 据 库 在 这 些 越 来 越 多 的 应 用 场景 下 显得 不 那么 合适 了 ， 为 了 解决 这 类 问题 的 
非 关 系数 据 库 应 运 而 生 。 

NoSQL 是 非 关 系 型 数据 存储 的 广义 定义 。 它 打破 了 长 久 以 来 关系 型 数据 库 与 ACID 理论 
大 一 统 的 局 面 。NoSQL 数据 存储 不 需要 固定 的 表 结构 ， 通 常 也 不 存在 连接 操作 。 在 大 数据 存 
取 上 具备 关系 型 数据 库 无 法 比拟 的 性 能 优势 。 该 术语 在 2009 年 初 得 到 了 广泛 认同 。 

当今 的 应 用 体系 结构 需要 数据 存储 在 横向 伸缩 性 上 能 够 满足 需求 。 而 NoSQL 存储 就 是 为 
了 实现 这 个 需求 。Google 的 BigTable 与 Amazon 的 Dynamo 是 非常 成 功 的 商业 NoSQL 实现 。 
一 些 开源 的 NoSQL 体系 ， 如 Facebook 的 Cassandra， Apache 的 HBase， 也 得 到 了 广泛 认同 。 


12.6.2 ”相关 理论 基础 


1， 一 致 性 

在 讨论 一 致 性 之 前 ， 先 看 一 下 CAP 理论 。 它 作为 一 种 理论 依据 ， 使 得 在 不 同 应 用 中 ,对 一 
致 性 也 有 了 不 同 的 要 求 .CAP 理论 : 简单 地 说 , 就 是 对 于 一 个 分 布 式 系统 ， 一 至 性 (Consisteney》、 
可 用 性 〈Availablity) 和 分 区 容忍 性 〈Partition tolerance) 三 个 特点 最 多 只 能 三 选 二 
一 致 性 意味 着 系统 在 执行 了 某 些 操作 后 仍 处 在 一 个 一 致 的 状态 ， 这 点 在 分 布 式 的 系统 中 万 
其 明显 。 比 如 某 用 户 在 一 处 对 共享 的 数据 进行 了 修改 ， 那 么 所 有 有 权 使 用 这 些 数据 的 用 户 都 可 
以 看 到 这 一 改变 。 简 言 之 ， 就 是 所 有 的 节点 在 同一 时 刻 有 相同 的 数据 。 
可 用 性 指 对 数据 的 所 有 操作 都 应 有 成 功 的 返回 。 高 可 用 性 则 是 在 系统 升级 〈 软 件 或 硬件 ) 
或 在 网 络 系统 中 的 某 些 节点 发 生 故障 的 时 候 ， 仍 可 以 正常 返回 。 简 言 之 ， 就 是 任何 请 求 不 管 成 
功 或 失败 都 有 响应 。 

分 区 容忍 性 这 一 概念 的 前 提 是 在 网 络 发 生 故障 的 时 候 。 在 网 络 连接 上 , 一 些 节点 出 现 故 障 ， 
使 得 原本 连通 的 网 络 变 成 了 一 块 一 块 的 分 区 ， 若 允许 系统 继续 工作 ， 那 么 就 是 分 区 可 容忍 的 。 
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在 数据 库 系 统 中 ， 事 务 的 ACID 属性 保证 了 数据 库 的 一 致 性 ， 比 如 银行 系统 中 ， 转 账 就 是 
一 个 事务 ， 从 原 账 户 扣除 金额 ， 以 及 向 目标 账户 添加 金额 ， 这 两 个 数据 库 操作 的 总 和 构成 一 个 
完整 的 逻辑 过 程 ， 具 有 原子 的 不 可 拆 分 特性 ， 从 而 保证 了 整个 系统 中 的 总 金额 没有 变化 。 
然而 ， 这 些 ACID 特性 对 于 大 型 的 分 布 式 系统 来 说 ， 适 合 高 性 能 不 兼容 的 。 比 如 ， 你 在 网 
上 书店 买书 ， 任 何 一 个 人 买书 这 个 过 程 都 会 锁 住 数据 库 直 到 买书 行为 彻底 完成 〈 和 否则 书本 库存 
数 可 能 不 一 致 )， 买 书 完成 的 那 一 瞬间 ， 世 界 上 所 有 的 人 都 可 以 看 到 书 的 库存 减少 了 一 本 〈 这 
也 意味 着 两 个 人 不 能 同时 买书 )。 这 在 小 的 网 上 书城 也 许可 以 运行 得 很 好 , 可 是 对 Amazon 这 种 
网 上 书城 却 并 不 是 很 好 。 
而 对 于 Amazon 这 种 系统 ， 他 也 许 会 用 Cache 系统 ， 剩 余 的 库存 数 也 许 是 之 前 几 秒 其 至 几 
个 小 时 前 的 快照 ， 而 不 是 实时 的 库存 数 ， 这 就 舍弃 了 一 致 性 。 并 且 ，Amazon 可 能 也 舍弃 了 独 
立 性 ， 当 只 剩 下 最 后 一 本 书 时 ， 也 许 它 会 允许 两 个 人 同时 下 单 ， 宁 愿 最 后 给 那个 下 单 成 功 却 没 
货 的 人 道歉 ， 而 不 是 整个 系统 性 能 的 下 降 。 
在 BASE 中 ， 强 调 可 用 性 的 同时 ， 引 入 了 最 终 一 致 性 这 个 概念 ， 不 像 ACID， 并 不 需要 每 
个 事务 都 是 一 致 的 ， 只 需要 整个 系统 经 过 一 定时 间 后 最 终 达 到 是 一 致 的 。 比 如 Amazon 的 卖 书 
系统 ， 也 许 在 卖 的 过 程 中 ， 每 个 用 户 看 到 的 库存 数 是 不 一 样 的 ， 但 最 终 卖 完 后 ， 库 存 数 都 为 0。 
再 比如 SNS 网 络 中 ，C 更 新 状态 ，A 也 许可 以 1 分 钟 才 看 到 , 而 B 甚至 5 分 钟 后 才 看 到 ， 但 最 
终 大 家 都 可 以 看 到 这 个 更 新 。 

由 于 CAP 理论 的 存在 ， 为 了 提高 性 能 ， 出 现 了 ACID 的 一 种 变种 BASE〈 这 四 个 字母 分 别 
是 Basically Available, Soft-state, Eventually consistency 的 开头 字母 ， 是 一 个 弱 一 致 性 的 理论 ,只 
要 求 最 终 一 致 性 ): 

。 Basic Availability: 基本 可 用 。 

。 ”Soft state: 软 状 态 , 可 以 理解 为 “无 连接 ”的 , 而 与 之 相对 应 的 Hard state 就 是 “而 

向 连接 ”的 。 
。 ”Eventual consistency: 最 终 一 致 性 ， 最 终 整 个 系统 〈 时 间 和 系统 的 要 求 有 关 ) 看 到 
的 数据 是 一 致 的 。 

具体 地 说 如 果 选 择 了 CP〈 一 致 性 和 分 区 容忍 )， 那 么 就 要 考虑 ACID 理论 〈 传 统 关 系 型 数 
据 库 的 基石 ， 事 务 的 四 个 特点 )。 如 果 选 择 了 AP〈 可 用 性 和 分 区 容忍 性 )， 那 么 就 要 考虑 BASE 
系统 。 如 果 选 择 了 CA (一 致 性 和 可 用 性 )， 如 Google 的 bigtable, 那么 在 网 络 发 生 分 区 的 时 候 ， 
将 不 能 进行 完整 的 操作 。 

ACID 理论 和 BASE 的 具体 对 比如 表 12-2 所 示 。 
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表 12-2 ACID 和 了 BASE 的 对 比 表 


ACID BASE 
强 一 致 性 弱 一 致 性 
隔离 性 优先 考虑 可 用 性 
关注 “操作 提交 ” 尽力 服务 
允许 事务 嵌 套 结果 对 精确 度 要 求 不 高 
可 用 性 ? 比较 “激进 ” 
比较 “保守 ” 更 简单 
难于 演变 更 快速 

易于 演变 


2. 分 区 


现在 ， 数 据 量 的 增加 已 经 使 得 数据 不 可 以 仅 在 单一 的 计算 机 系统 中 存储 (分 布 式 的 应 用 )， 尤 
其 是 为 了 保证 数据 的 可 靠 性 ， 有 了 时 需要 复制 备份 。 同 时 ， 为 了 一 些 规模 性 的 操作 比如 负载 平衡 
或 者 考虑 到 一 些 动态 因素 的 影响 (存储 节点 的 改变 )， 在 设计 中 就 要 考虑 “分 区 ”的 概念 。 


分 区 的 一 些 主要 方法 如 下 。 


(1) 内 存 缓 存 : 缓存 技术 可 以 看 成 一 种 分 区 。 内 存 中 的 数据 库 系 统 将 使 用 频率 最 高 的 数据 
复制 到 缓存 中 ， 加 快 了 数据 给 用 户 传递 的 速度 同时 也 大 大 减轻 了 数据 库 服 务 器 的 负担 。 在 分 布 
式 缓存 中 ， 缓 存 由 很 多 带 有 分 配 好 一 定 内 存 的 进程 组 成 ， 它 们 能 够 放置 到 不 同 的 机 器 上 并 且 可 


以 通过 配置 进行 应 用 。 它 的 协议 可 以 在 不 同 的 编程 语言 中 实现 ， 同 时 在 用 户 的 应 
单 的 键 值 存储 API。 它 通过 将 键 值 哈 希 散 列 到 缓存 中 来 存储 对 象 。 


中 提供 了 简 


(2) 集群 : 数据 库 服务 器 集群 在 为 用 户 提供 服务 时 的 透明 性 〈 用 户 感觉 数据 像 是 在 同一 个 
也 方 )， 是 另外 一 个 对 数据 进行 分 区 的 方法 。 然 而 ， 这 种 方法 虽然 能 在 某 种 程度 上 扩展 系统 数 


据 持 久 层 ， 可 是 集群 本 身 的 特性 却 仅仅 只 应 用 在 了 数据 库 管理 系统 的 顶层 ， 而 并 未 在 分 布 式 最 


初 的 设计 中 得 到 应 用 。 


(3) 读 写 分 离 : 指定 一 台 或 多 台 主 服务 器 ， 所 有 或 部 分 的 写 操作 被 送 至 此 ， 同 时 再 设 一定 


数量 的 副本 服务 器 用 以 满足 读 请 求 。 如 果 主 服务 器 向 至 少 一 个 用 户 异 步 复制 数据 ， 


这 是 没有 写 


延迟 的 ， 可 如 果 主 服务 器 在 向 最 后 一 个 用 户 写 数据 还 没完 成 的 时 候 就 骨 演 了 ， 那 么 写 操作 将 是 


无 效 的 ， 如 果 主 服务 器 向 用 户 同步 复制 数据 ， 这 是 有 延迟 的 ， 这 种 更 新 不 会 丢失 ， 


但 读 请 求 却 


不 能 送 达 副本 服务 器 。 如 果 对 一 致 性 要 求 很 高 的 话 , 无 法 避免 进一步 的 写 延 迟 。 在 这 种 情况 下 ， 
如 果 主 服务 器 月 省 了 ， 那 么 有 最 新 的 数据 的 副本 服务 器 将 会 成 为 新 的 主 服务 器 。 这 种 模型 〈 主 


/从 模型 ) 在 读 写 率 很 高 的 时 候 工 作 得 很 好 。 


(4) 范围 分 割 技术 /分 片 (sharding): 指 对 数据 按照 如 下 的 方式 进行 分 区 操作 : 对 数据 的 请 
求 和 更 新 在 同一 个 节点 上 ， 并 且 对 于 分 布 在 不 同 服务 器 上 的 数据 存储 和 下 载 的 量 大 致 相同 。 从 
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可 靠 性 和 负载 平衡 的 观点 看 ， 数 据 的 碎片 也 是 需要 被 复制 的 ， 并 且 允 许 它们 被 写 入 主 服务 器 的 
副本 中 和 所 有 需要 维护 数据 分 区 的 副本 服务 器 中 。 而 为 了 做 到 这 一 点 ， 需 要 在 分 区 和 存储 节点 
之 间 做 一 个 映射 。 这 个 映射 是 动态 还 是 静态 取决 于 用 户 的 应 用 、 主 服务 器 的 “映射 服务 /组 件 ” 
以 及 网 络 中 用 户 应 用 于 网 络 节点 之 间 的 基础 结构 。 在 分 区 场景 中 ， 关 键 在 于 如 何 将 数据 库 中 的 
对 象 映 射 到 服务 器 上 。 通 常 的 方法 是 哈 希 散 列 法 。 


3， 存储 分 布 


存储 布局 是 确定 了 如 何 访问 磁盘 ， 以 及 如 何 直接 影响 性 能 。 主 要 分 为 基于 行 的 存储 布 
列 存储 布局 、 带 有 局 部 性 群 组 的 列 存储 布局 、LSM-Tree 四 种 。 

1) 行 存储 和 列 存储 

这 里 首先 介绍 行 存储 和 列 存储 。 两 者 之 间 的 主要 区 别 在 于 ， 行 存储 将 每 条 记录 的 所 有 字段 
的 数据 聚合 存储 ， 而 列 存储 将 所 有 记录 中 相同 字段 的 数据 聚合 存储 。 举 个 简单 的 例子 如 表 12-3 
所 示 。 


可 


表 12-3 员工 信息 表 


工资 
4200 
3800 
4900 


员工 号 
7001 
7002 
7003 


对 于 传统 的 行 存储 ， 表 格 中 的 每 一 行 〈 每 一 条 记录 ) 在 磁盘 上 是 紧密 排列 的 ， 如 下 所 示 : 
7001， 高 ， 大 海 ，4200; 
7002， 王 ， 胜 利 ，3800; 
7003， 李 ， 小 鹏 ，3900; 
而 列 存储 ， 将 表格 中 每 一 列 的 数据 项 放 在 了 一 起 ， 如 下 所 示 : 
7001, 7002, 7003; 
高 , 王 , 李 
大 海 ， 胜 利 ， 小 鹏 ; 
4200, 3800, 3900; 
总 结 来 说 ， 行 存储 主要 适合 于 OLTP， 或 者 更 新 操作 ， 尤 其 是 插入 、 删 除 操作 频繁 的 场合 ; 
而 列 存储 主要 适用 于 OLAP， 数 据 仓库 ， 数 据 挖掘 等 查询 密集 型 应 用 。 
列 存 储 相 对 行 存储 的 优点 主要 有 两 个 。 
。 ”每 个 字段 的 数据 聚集 存储 ， 在 查询 只 需要 少数 几 个 字段 的 时 候 能 大 大 减少 读 取 的 数据 
量 。 而 查询 密集 型 应 用 的 特点 之 一 就 是 查询 一 般 只 关心 少数 几 个 字段 ， 而 行 存储 每 次 
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。 ”既然 一 个 字段 的 数据 聚集 存储 ， 那 就 更 容易 为 这 种 聚集 存储 设计 更 好 的 压缩 /解压 算法 。 
2) 带 有 局 部 性 群 组 的 列 存 储 
带 有 局 部 性 群 组 的 列 存储 ， 它 和 列 存 储 很 相似 ， 但 是 增加 了 局 部 性 群 组 的 特色 。 
首先 这 里 需要 介绍 一 下 局 部 性 群 组 , 它 是 在 Google 的 关于 Bigtable 的 论文 中 第 一 次 提 到 的 。 
它 是 指 根据 需要 将 原来 不 存储 在 一 起 的 数据 ， 以 列 族 为 单位 存储 至 单独 的 字 表 中 。 如 用 户 对 网 
站 排名 、 语 言 等 分 析 信息 感 兴趣 ， 那 么 可 以 将 这 些 列 族 放 在 单独 的 子 表 ， 减 少 无 用 信息 读 取 ， 
改善 存 取 效 率 。 
而 对 于 上 面 的 例子 ， 带 有 局 部 性 群 组 的 列 存储 就 可 以 如 下 所 示 : 
7001, 7002, 7003; 
高 ， 大 海 ，4200; 
王 ， 胜 利 ，3800; 
李 ， 小 鹏 ，3900; 
3) LSM-tree 
LSM-tree (Log Structured Merge Trees， 日 志 结构 合并 树 ) 与 前 面 介绍 的 存储 结构 有 所 不 同 ， 
前 面 的 存储 结构 在 描述 如 何 序列 化 逻辑 数据 结构 ， 而 LSM-tree 描述 的 则 是 为 了 满足 高 效 、 高 性 
E、 安 全 的 读 写 的 要 求 ， 如 何 有 效 地 利用 内 存 和 磁盘 存储 。LSM-tree 的 观点 是 由 Patrick ONeil 
在 1996 年 率先 提出 的 。LSM-tree 算法 思想 主要 用 于 解决 日 志 记录 索引 的 问题 ， 这 种 应 用 的 特点 
是 数据 量 大 、 写 速率 高 (2000 条 / 秒 ), 又 要 建立 有 效 的 索引 来 查找 日 志 中 的 特定 条 目 。Patrick ONeil 
的 做 法 是 ， 在 内 存 里 维护 一 个 相同 的 B 树 ， 当 内 存 中 的 B 树 达到 阔 值 时 ， 批 量 进 行 滚动 合并 。 
而 LSM-Tree 的 典型 例子 就 是 Google 的 Bigtable。 下 面 将 结合 Bigtable 进行 具体 解释 
LSM-tree 的 工作 原理 。 
当初 Google 设计 Bigtable 的 原因 有 两 个 ， 一 是 Google 需要 存储 的 数据 种 类 繁多 ， 二 是 海 
量 的 服务 请 求 。Google 的 需求 是 : 数据 存储 可 靠 性 、 高 速 数 据 检索 与 读 取 、 存 储 海量 的 记录 、 
可 以 保持 记录 的 多 个 版 本 。 图 12-13 是 Bigtable 中 的 合并 / 转 储 引 擎 结构 图 。 
用 户 的 操作 首先 写 入 到 MemTable 中 ， 当 内 存 中 的 MemTable 达到 一 定 的 大 小 时 ， 需 要 将 
MemTable 转 储 到 持久 化 存储 中 生成 SSTable 文件 。 这 里 需要 注意 ,除了 最 早 写 入 的 SSTable 存 
放 了 最 终结 果 以 外 ， 其 他 的 SSTable 和 MemTable 存放 的 都 是 用 户 的 更 新 操作 ， 比 如 对 指定 行 
的 某 个 列 加 一 操作 ， 删 除 某 一 行 等 。 每 次 读 取 或 者 扫描 操作 都 需要 对 所 有 的 SSTable 及 
MemTable 按照 时 间 从 旧 到 新 进行 一 次 多 路 归并 ， 从 而 获取 最 终结 果 。 
如 果 要 确保 数据 不 能 丢失 ， 为 了 应 对 服务 器 遇 到 不 可 抵抗 外 力 因素 造成 宕 机 的 情况 ，LSM 
有 两 次 持久 化 过 程 : 一 次 是 log， 以 append 形式 对 所 有 的 update 操作 先进 行 日 志 记录 ， 一 旦 出 


卫 | 


现 意外 情况 ， 即 可 以 恢复 log 中 的 内 容 到 MemTable; 第 二 次 是 swap， 邦 
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的 时 候 直接 转 储 到 磁盘 上 形成 新 的 SSTable。 


Memory 


Memtable 并 读 操 作 】 


GFS 


tablet log 


4. 查询 模型 


SSTable 文人 


图 12-13 ”合并 / 转 储 引 擎 结构 


民 和 新 技术 “国医 


E MemTable 达到 阔 值 


不 同 的 NoSQL 数据 存储 提供 的 查询 功能 有 重大 分 歧 。 然 而 设计 的 键 值 存储 仅仅 提供 通过 
主键 或 一 些 id 字段 查找 的 功能 ， 并 且 缺 乏 查询 更 进一步 域 的 能 力 ， 而 其 他 数据 存储 ( 像 文 档 的 
数据 库 CouchDB 和 MongoDB) 则 允许 某 些 复杂 查询 。 在 许多 NoSQL 数据 库 的 设计 中 ， 相 对 


于 性 能 和 可 扩展 性 来 说 ， 丰 富 的 动态 查询 功能 已 被 省 略 的 现状 是 并 
用 NoSQL 数据 库 时 ， 在 使 用 情况 下 需要 至 少 有 一 些 非 主键 属性 查询 功能 。 
现在 许多 NoSQL 数据 库 是 基于 DHT (Distributed Hash Table， 分 散 哈 希 表 ) 模型 的 。 为 了 访问 
和 修改 对 象 数据 ， 客 户 端 要 求 提供 对 象 的 主键 ， 然 后 数据 库 再 根据 提供 的 主键 进行 相等 匹配 。 


F 不 奇怪 的 。 男 一 方面 ， 在 使 


例如 ， 我 们 使 用 DHT 实现 一 个 顾客 数据 库 ， 选 择 顾客 编号 cust_id 作为 主键 。 那 么 如 果 我 


们 知道 一 个 顾客 对 象 的 cust_id， 


那么 我 们 就 能 进行 get/set/operate 操作 了 。 


现实 世界 中 ,我 们 可 能 想 要 基于 非 主 属性 查找 数据 ， 我 们 也 可 能 基于 “大 于 /不 小 于 ”关系 
进行 查找 ， 或 者 我 们 可 能 用 一 个 布尔 表达 式 来 组 合 查 询 条 件 。 
下 面 将 介绍 几 个 NoSQL 中 常见 的 查询 模型 。 


1) 结合 SQL 数据 库 


一 个 最 直接 的 方式 是 通过 将 NoSQL 数据 库 拷贝 到 关系 数据 库 或 者 文本 数据 库 ， 从 而 来 提 
供 查 询 能 力 。 当 然 ， 这 就 要 求 关系 数据 库 要 足够 大 以 便 能 够 存储 每 个 对 象 的 查询 


们 仅仅 将 要 查找 的 属性 存 到 数据 


属性 。 由 于 我 


库 中 ， 而 不 是 整个 对 象 ， 故 该 方法 是 一 个 非常 实 


法 。 结 合 SQL 数据 库 的 查询 模型 如 图 12-14 所 示 。 


有 且 常 见 的 方 
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cust id Zipcode income desc 


RDBMS 


男 国 | 


查询 处 理 器 


SA 通过 cust id 访 
问 存储 在 DHT 
中 的 客户 对 象 


1. 搜 索 RDBMS 
2. 从 DHT 得 到 数据 


t 值 存储 
图 12-14 结合 SQL 数据 库 的 查询 模型 
2) 分 散 /集合 本 地 搜索 
一 些 NoSQL 数据 库 提供 本 地 数据 库 内 的 索引 和 查询 处 理 机 制 。 在 这 种 情况 下 ， 我 们 可 以 
让 查询 处 理 器 将 查询 广播 到 DHT 中 的 所 有 节点 ， 在 每 个 节点 上 将 会 执行 查询 ， 并 将 结果 送 回 
到 查询 处 理 器 ， 然 后 查询 处 理 器 将 结果 聚集 成 一 个 单一 响应 。 需 要 注意 的 是 搜索 并 行 地 发 生 在 
DHT 中 所 有 节点 上 。 分 散 /集合 本 地 搜索 的 查询 模型 如 图 12-15 所 示 。 


每 个 节点 执 
行 局 部 搜索 


2 


1. 广 播 查 询 
2. 聚 合 结果 


= 


键 值 存储 | 


图 12-15 分 散 /集合 本 地 搜索 的 查询 模型 


3) 分 布 式 B+ 树 

B+ 树 是 一 种 用 在 关系 型 数据 库 管 理 系统 中 常见 的 索引 结构 。B+ 树 的 分 布 式 版 本 可 以 用 在 
DHT 环境 中 。 其 基本 思路 是 为 了 定位 B+ 树 的 根 节 点 哈 希 要 搜索 的 属性 。 根 节点 的 “ 值 ”包含 
其 孩子 节点 的 ID。 因此， 客户 端 为 了 找到 孩子 节点 可 以 发 起 另 一 个 DHT 查找 调用 。 继 续 这 个 
过 程 ， 客 户 端 最 终 向 下 导航 到 叶 节 点 ， 从 而 与 搜索 条 件 匹 配 。 紧 接着 ， 为 了 提取 实际 的 对 象 ， 
客户 端 将 发 起 另 一 个 DHT 查找 。 

值得 注意 的 是 ， 对 象 的 创建 和 删除 将 会 引起 B+ 树 节点 的 拆 分 /合并 更 新 。 这 应 该 以 原子 的 
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方式 进行 。 分 布 式 事务 是 一 项 昂贵 的 操作 ， 但 它 的 使 用 在 这 呈 


的 更 新 很 少 涉及 超过 一 台 机 器 。 分 布 式 B+ 树 的 查询 模型 如 


昌 为 大 多 数 的 B+ 树 
6 所 万 


1 访问 B+ 树 根 
2. 导 航 B+ 树 叶子 


3, 使 用 id 得 到 实际 对 象 


键 值 存储 


12-16 分布 式 B+ 树 的 查询 模型 
4) 前 级 哈 希 表 /分 布 式 Trie 


分 支 节点 只 包含 


前 缀 哈 希 表 (Prefix Hash Table，PHT， 又 名 分 布 式 Trie) 是 一 个 树 型 数据 结构 。 在 这 个 树 
两 个 孩子 节点 


型 结构 中 ， 从 根 节点 到 叶子 的 每 一 条 路 径 上 均 包 含 了 键 值 的 前 级 ， 并 且 每 个 Trie 中 的 节点 都 包 
含 了 它 是 谁 的 前 缀 的 所 有 数据 。PHT 主要 包含 三 个 操作 : lookup，range query 和 insert/delete。 
前 绷 哈 希 表 的 查询 模型 如 图 12-17 所 示 。 


-个 二 元 Trie 


分 支 节点 在 下 面 
至 少 有 B+1 个 键 


\ 叶子 节点 最 多 能 | | 叶子 节点 按 升序 包含 所 
\ 存储 B 个 键 有 路 径 前 缀 111 开 头 的 键 
了 
\ 1 
贺 叶子 节点 被 链 在 一 起 ， 所 
a 有 叶子 节点 按 顺 序 链接 
图 12-17 


前 缀 哈 希 表 的 查询 模型 
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12.6.3 ”NoSQL 数据 库 的 种 类 


1 


在 传统 的 数据 库 中 ， 数 据 是 被 分 割 成 离散 的 数据 段 ， 而 文档 存储 见 
基本 单位 。 文 档 存储 一 般 
具有 以 下 特征 ; 


.文档 存储 


是 以 文档 为 存储 信息 的 


即使 不 定义 表 结构 ， 也 可 以 像 定义 了 表 结 构 


类 似 json 的 格式 存储 ， 存 储 的 内 容 是 文档 型 的 。 面 向 文档 的 数据 库 
样 来 使 用 。 另 外 ， 面 向 文档 的 数 


据 库 可 以 通过 复杂 的 查询 条 件 来 获取 数据 。 虽 然 不 具备 事务 处 理 和 JOIN 关系 型 数据 库 所 具有 
的 处 理 能 力 ， 但 其 他 的 处 理 基本 都 可 以 实现 。 


在 
了 


物理 


很 大 的 不 同 ， 而 最 大 的 不 同 则 在 于 它 不 提供 对 参数 完整 性 和 分 布 事物 的 支持 ; 
也 并 不 排斥 ， 可 以 进行 数据 的 交换 。 鉴 于 以 上 特点 一 些 术 语 也 发 生 了 变化 ， 久 


E 文 档 存储 中 ， 文 档 可 


逻辑 上 的 独立 性 ， 这 就 和 具有 高 度 结构 化 的 表 存 储 ( 关 系 型 数据 库 的 3 


以 很 长 ， 很 复杂 ， 无 结构 ， 可 以 是 任意 结构 的 字段 ， 并 且 数 据 具有 
E 要 存储 结构 ) 有 


不 过 ， 它 们 之 间 
表 12-4 所 示 。 


表 12-4 文档 型 数据 库 用 语 


文档 型 数据 库 用 语 


现在 一 些 主流 的 文档 型 数据 库 如 表 12-5 所 示 。 
表 12-5 文档 存储 型 数据 库 
名 称 查询 语言 注释 

BaseX Xquery, Java XML 型 数据 库 
CouchDB Erlang 
eXist Xquery XML 型 数据 库 
Jackrabbit Java 
Lotus Notes LotusScript, Java, others 多 键 值 
MarkLogic Server Xque XML 型 数据 库 
MongoDB CH+ JSON 型 数据 库 
OrientDB, Java 
SimpleDB Erlang 
Terrastore Java 

现在 ， 我 们 简要 介绍 其 中 比较 常用 的 MongoDB。MongoDB 是 10gen 公司 开发 的 以 高 性 能 


和 可 扩展 性 为 特征 的 文档 型 数据 局 


。MongoDB 的 最 大 特点 就 是 无 表 结 构 。 在 保存 数据 和 数据 
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结构 的 时 候 ， 会 把 数据 和 数据 结构 都 完整 地 以 BSON 的 形式 保存 起 来 (BSON 是 JSON 的 二 进 
制 编码 格式 , 但 比 JSON 支持 更 加 复杂 的 格式 ， 在 空间 利用 上 更 加 高 效 )， 并 把 它 作为 值 和 特定 


的 键 进 行 关联 。 正 是 


于 这 种 设计 ， 因 此 它 不 需要 表 结 构 ， 而 被 称 为 文档 型 数据 库 。 


这 里 说 的 文档 ， 是 一 种 可 以 媒 套 的 数据 集合 。 从 关系 数据 库 的 范式 的 概念 来 说 ， 媒 套 是 明 
显 的 反 范式 设计 。 范 式 设计 的 好 处 是 消除 了 依赖 ， 但 是 增加 了 关联 ， 查 询 需 要 通过 关联 两 张 或 
者 多 张 表 来 获得 所 需要 的 全 部 数据 ， 但 是 更 改 操作 是 原子 的 ， 只 需要 修改 一 个 地 方 即 可 。 反 范 
式 则 是 增加 了 数据 元 余 来 提升 查询 性 能 ， 但 更 新 操作 可 能 需要 更 新 元 余 的 多 处 数据 ， 需 要 注意 


一 致 性 的 问题 。 


于 其 最 大 的 特点 就 是 无 表 结构 ， 无 论 是 定义 还 是 使 用 ; 所 以 ， 对 于 任何 关键 字 ， 它 都 可 


以 像 关系 型 数据 库 那 样 进 行 复杂 的 查询 。 此 外 ，MongoDB 拥有 比 关系 型 数据 库 更 快 的 速度 ， 
而 且 ， 可 以 像 关 系 型 数据 库 那样 通过 添加 索引 来 进行 高 速 处 理 。 

根据 它 的 特点 ， 可 以 通过 “添加 字段 ” “查询 数据 ”这 两 个 操作 来 看 出 MongoDB 与 传统 
的 关系 型 数据 库 的 优势 与 不 足 ， 如 表 12-6 所 示 。 


数据 库 名 称 
传统 的 关系 型 数据 库 


MongoDB 


因此 ， 在 实际 应 
使 用 ， 当 然 ， 可 以 在 


大 的 查询 语言 可 以 有 
的 分 区 方法 采用 的 是 
MangoDB 为 C、 


表 12-6 MongoDB 与 传统 的 关系 型 数据 库 的 比较 


添加 字段 | 查询 数据 | 事物 处 理 


进行 表 结构 的 变更 ， 然 
先进 行 表 结构 的 变更 ， 然 | 严格 根据 谓词 逻辑 可 以 


后 在 程序 中 进行 修改 


灵 it , 但 不 支持 Joi 
只 对 程序 进行 修改 ee 但 不 支持 Join 不 支持 


用 中 ， 我 们 要 根据 它 的 特点 灵活 使 用 : 在 最 初 的 设计 时 就 避免 join 查询 的 


最 开始 的 时 候 就 将 必要 的 数据 嵌入 到 文档 中 去 ， 这 可 以 实现 同样 的 功能 。 
除 此 之 外 ，MongoDB 有 它 自 己 的 通信 协议 ， 有 几 种 语言 的 socket 驱动 。MongoDB 还 有 强 


SQL 相 媲 美 ， 它 的 查询 语言 同样 支持 Map/reduce 函数 。 此 外 ，MongoDB 
“ 读 写 分 离 ” 以 主 从 模式 对 数据 进行 复制 和 修改 。 
C#、.NET、Java、PHP 等 各 种 开发 语言 提供 了 程序 库 ， 如 表 12-7 所 示 。 


表 12-7 MangoDB 为 各 种 开发 语言 提供 的 程序 库 〈 部 分 ) 


开发 语言 程 序 库 

Java Morphia 

PHP mongo 

Ruby Rmongo, mongo-ruby-dirver 
Objective C NuMongoDB 
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续 表 
开发 语言 程 序 库 
Perl MonoDB 
R RMongo 
Lua LuaMongo 


Java 驱动 程序 是 MangoDB 最 早 的 驱动 程序 ， 它 已 经 使 用 多 年 ， 而 且 非 常 稳定 ， 是 企业 级 
开发 的 首选 。 下 面 使 用 Java 驱动 程序 来 举 一 个 各 种 汽车 信息 统计 的 搜索 引擎 的 例子 , 每 种 汽车 
收集 的 信息 都 不 同 ， 本 例子 的 目的 是 使 得 这 些 信息 都 能 被 搜索 到 。 

【 例 12.1】 汽车 信息 统计 的 搜索 引擎 。 这 个 问题 的 重点 在 于 每 种 汽车 收集 的 信息 都 不 同 ， 
要 能 对 全 部 这 些 属 性 做 快速 的 搜索 。 比 如 奥迪 只 有 一 个 价格 信息 ， 而 宝马 有 价格 、 车 身 重 量 和 
排 量 等 。 奥 迪 的 文档 比较 简单 ; 


{ 
“name” : “Audi”, 


“Price” : 920000 
} 
宝马 的 属性 就 比较 多 ， 所 以 他 的 文档 也 复杂 一 些 : 


“name” : “BMW”, 


“Price” : 890000, 
“Weight” : { 
“value” : 1930, 
“units” : “kg” 
}， 


“Engine” : { 


“value” : 3.0, 


“units” : ‘LL” 


} 
MangoDB 能 存放 任意 数量 、 任 意 属性 的 被 统计 信息 ， 这 样 应 用 就 能 轻易 扩展 ， 但 目前 还 
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不 能 对 当前 的 格式 进行 有 效 的 索引 。MangoDB 索引 可 以 将 数组 的 每 一 个 元 素 进行 涵盖 ， 所 以 
可 以 将 想 要 索引 的 属性 放 到 一 个 保护 常用 键 名 的 数组 中 。 例 如 ， 对 于 宝马 汽车 ， 可 以 为 索引 添 


加 一 个 数组 ， 将 全 部 属性 放 到 数组 中 : 


{ 

“name” : “BMW”, 

“price”: 890000, 

“weight” : { 
“value” : 1930, 
“units” : “kg” 

}, 

“engine” : { 
“value” : 3.0, 
“units” : “L” 

}, 

“index” : [ 
fname”: “price”, “value” : 890000}, 
{“name” : “weight”, “value” : 1930}, 


fname”: “engine”, “value” : 3.0}, 


对 于 奥迪 汽车 ， 只 有 一 个 属性 ， 就 是 价格 : 


“name” : “Audi”, 
“price” : 920000, 
“index” : [ 


{“name” : “Price”, “value” : 920000}, 


} 


现在 只 要 创建 一 个 “index.name” 和 “index.value” 的 复合 索引 就 行 了 。 使 用 Java 代码 举 


例 ， 使 用 ensureIndex 函数 建 复合 索引 : 
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BasicDBOject index = new BasicDBObject (); 
index.put (“index.name”, 1); 


index.put (“index.value”, 1); 


autoinfo.ensureIndex (index); 
实现 宝马 汽车 信息 的 文档 如 下 : 


public static DBOject creatBMWO { 
BasicDBObject bp= new BasicDBObiject 0; 
bp.put (name”“BMW”); 
bp.put (“Price”, 890000); 


BasicDBObject bweight = new BasicDBObject (); 
bweight.put (“value", 1930); 

bweight.put (“units”, “kg”); 

bp.put (“weight”, bweight); 


BasicDBObject bengine =new BasicDBObject (); 
bengine.put (“value”, 3.0); 
bengine.put (“units”, “L”™); 


bp.put (“engine”, bengine); 


ArrayList<BasicDBObject> index = new ArrayList < BasicDBObject > (); 
index.add (BasicDBObjectBuilderstart 0 
.add(“name”, “price”) .add(“value”, 890000) .getO) ; 
index.add (BasicDBObjectBuilder.start 0 
.add(“name”, “weight”) .add(“value”, 1930) .getO) ; 
index.add (BasicDBObjectBuilder.start 0 
.add(‘name”, “engine”) .add(“value”, 3.0) .getO) ; 
bp.put (“index”, index); 


return bp; 


} 
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只 要 实现 了 javautiLList， 就 可 以 用 来 表示 数组 ， 所 以 用 java.tuil.ArrayList 来 存放 表示 汽车 
不 同属 性 信息 的 内 妖 文 档 。 

除了 应 用 比较 多 的 MangoDB 文档 数据 库 之 外 ， 另 外 还 有 如 下 一 些 在 应 用 中 使 用 比较 多 的 
文档 型 数据 库 。 

BaseX 是 一 个 非常 轻巧 和 高 性 能 的 XML 数据 库 系统 和 Xpath/Xquery 处 理 。 包含 了 对 W3C 
Update 和 FullText 扩展 的 全 面 支持 。 一 个 可 交互 和 友好 的 GUI 前 台 操 作 界 面 ， 可 以 用 Xquery 
查询 相关 数据 库 的 XML 文件 ， 也 可 动态 展示 xml 文件 层次 和 节点 关系 的 图 。 它 具有 高 度 的 交 
互 可 视 性 ， 可 实时 执行 和 可 进行 xquery 编辑 的 特点 。 

CouchDB 也 是 一 种 面向 文档 的 非 关 系 型 数据 库 ， 用 Erlang 编写 ， 它 主要 致力 于 健壮 性 、 高 
并 发 性 和 容错 性 。 它 与 其 他 NoSQL 数据 库 最 大 的 不 同 在 于 它 的 双流 向 增加 副本 。CouchDB 的 
文件 也 是 基于 JSON， 但 同样 也 有 二 进 制 的 设置 ， 它 的 API 基于 REST， 用 标准 的 动词 GET、 
PUTPOST 和 DELETE。 可 以 用 JavaScript 来 操作 CouchDB， 用 户 可 以 通过 Map/reduce 函数 来 
生成 自己 的 视图 。 

Lotus Notes 也 是 目前 较为 流行 的 文档 数据 库 系统 之 一 。 作 为 群 件 系统 ， 它 利用 自身 强大 的 
功能 使 其 在 企业 、 政 府 办 公 自 动 化 方面 的 应 用 越 来 越 广 。 它 实现 了 业务 流程 化 ， 并 且 在 全 文 检 
索 、 复 制 、 集 成 开发 环境 和 7 层 安全 机 制 等 方面 都 有 自己 独特 的 定义 。 但 是 其 结构 也 决定 了 它 
不 适 于 传统 的 关系 型 数据 库 所 擅长 的 事务 处 理 方面 的 工作 。 


2， 键 值 存储 


键 值 存储 模型 是 最 简单 ， 也 是 最 方便 使 用 的 数据 模型 ， 它 支持 简单 的 键 对 值 的 键 值 存储 和 
提取 。 根 据 一 个 简单 的 字符 串 〈 键 ) 能 够 返回 一 个 任意 类 型 的 数据 〈 值 )。 键 值 存储 最 大 的 好 
处 是 不 用 为 值 指定 一 个 特定 的 数据 类 型 ， 这 样 就 能 在 值 里 存储 任意 类 型 的 数据 。 系 统 将 这 些 信 
息 按照 BLOB 大 对 象 进行 存储 ， 当 收 到 检索 请 求 时 ， 返 回 同样 的 BLOB。 由 应 用 来 决定 被 使 用 
的 数据 是 什么 类 型 ， 如 字符 串 、 图 片 和 XML 文件 等 。 键 值 存储 数据 库 的 主要 特点 是 具有 极 高 
的 并 发 读 写 性 能 。 

键 值 存 储 中 的 键 是 很 灵活 的 ， 可 以 是 图 片 名 称 、 网 页 URL 或 者 文件 路 径 名 ， 它 们 指向 
些 图 片 、 网 页 和 对 应 的 文档 。 键 可 以 用 很 多 种 格式 来 表示 。 

。 图 片 或 者 文件 的 路 径 名 

。 根据 值 的 哈 希 值 生成 的 字符 串 

。 REST Web 服务 调用 

。 SQL 查询 

值 也 很 灵活 ， 并 且 可 以 是 任何 BLOB 数据 ， 如 字符 串 、 图 片 、 网 页 或 视频 。 表 12-8 是 一 


去 
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个 键 值 存储 的 示例 。 
表 12-8 ” 键 值 存储 的 示例 
类 型 键 值 
图 片 名 称 Binary image file 
网 页 URL HTML of a web page 
文件 路 径 名 C:/usr/Zhang/filel.doc WORD document 
MD5 哈 希 8089e36d6iojfej2ofeif93089r0930r This is a test. 
REST Web 服务 调用 | View-person?person-id=123&format=xml | <Person><id>123</id></Person> 
SQL 查询 SELECT * FROM STUDENT Ld 


键 值 存储 中 存在 三 种 操作 : put、get 和 delete。 这 三 种 操作 规定 了 程序 员 与 键 值 存储 交互 的 
基本 方式 。 应 用 开发 者 使 用 put、get 和 delete 函数 访问 和 操作 键 值 存储 。 
(1) put($key as xs:string, $value as item() ) 对 表 添 加 一 个 新 的 键 值 对 ， 并 且 当 键 存 在 时 ， 更 
新 键 对 应 的 值 。 
(2) get($key as xs:string) as item( ) 根 据 给 出 的 任意 键 返 回 键 对 应 的 值 ， 如 果 键 值 存储 中 没 
有 该 键 ， 将 返回 一 个 错误 信息 。 
(3) delete($key as xs:string) 将 键 和 对 应 的 值 从 表 中 删除 ， 如 果 键 值 存储 中 没有 该 键 ， 将 返 
一 个 错误 信息 。 
键 值 存 储 的 数据 库 根 据 数据 的 保存 方式 可 以 分 为 临时 性 、 永 久 性 和 两 者 兼 具 三 种 。 
1) 临时 性 保存 类 型 
临时 性 的 保存 有 可 能 丢失 数据 。 这 类 数据 库 一 般 把 数据 都 保存 在 内 存 中 ， 这 样 读 和 写 的 速 
度 都 非常 快 ， 但 是 当 数 据 库 停 止 或 者 机 器 重启 后 ， 数 据 就 不 存在 了 。 由 于 数据 保存 在 内 存 中 ， 
所 以 也 无 法 操作 内 存 容量 的 数据 ， 旧 的 数据 会 丢失 。 特 点 可 以 总 结 如 下 : 
。 在 内 存 中 保存 数据 
。 可 以 快速 进行 读 和 写 
。 数据 有 可 能 丢失 
2) 永久 性 保存 类 型 
永久 性 的 保存 不 会 丢失 数据 。 这 类 数据 库 一 般 不 把 数据 保存 在 内 存 中 ， 而 是 把 数据 保存 在 
硬盘 上 。 与 临时 性 在 内 存 中 读 和 写 数据 比较 起 来 ， 由 于 牵扯 到 对 硬盘 的 IO 操作 ， 所 以 性 能 上 
的 差距 是 显而易见 的 。 但 是 它 的 最 大 优势 是 不 会 丢失 数据 。 特 点 可 以 总 结 如 下 : 
。 在 硬盘 上 保存 数据 
。 ”可 以 进行 较 快速 的 读 和 写 操作 
。 数据 不 会 丢失 


回 
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3) 两 者 兼 具 型 

这 类 数据 库 兼 具 临时 性 保存 和 永久 性 保存 的 优点 。 比 如 典型 的 Redis 系统 ， 它 首先 把 数据 
保存 在 内 存 中 ， 平 时 都 在 内 存 中 进行 读 和 写 操作 。 在 满足 特定 条 件 〈 默 认 是 15 分 钟 一 次 以 上 ， 
5 分 钟 10 个 以 上 或 1 分 钟 1000 个 以 上 的 键 发 生变 化 ) 时 ， 将 数据 写 入 到 硬盘 上 保存 。 这 样 既 
确保 了 内 存 中 数据 处 理 的 高 速 性 ， 又 通过 写 入 硬盘 来 保证 数据 的 永久 性 。 这 种 类 型 的 数据 库 特 
别 适合 处 理 数 组 类 型 的 数据 ， 特 点 可 以 总 结 如 下 : 

。 同时 在 内 存 和 硬盘 上 保存 数据 

。 ”可 以 进行 非常 快速 的 读 和 写 操作 

。 保存 在 硬盘 上 的 数据 不 会 丢失 

键 值 存 储 产品 主要 有 亚马逊 的 Memcached、Redis`Dynamo、Project Voldemort、Tokyo Tyrant、 
Riak、Scalaries 这 几 个 数据 库 ， 这 里 主要 介绍 一 下 Memcached 和 Redis。 

1) Memcached。Memcached 属于 前 面 分 类 中 的 临时 性 保存 类 型 ， 是 高 性 能 的 分 布 式 内 存 
对 象 绥 存 系统 。 一 般 的 使 用 目的 是 ， 通 过 缓存 数据 库 查 询 结果 ， 减 少数 据 库 访问 次 数 ， 以 提高 
动态 Web 应 用 的 速度 、 提 高 可 扩展 性 。 它 和 共享 内 存 、APC 等 本 地 缓存 的 区 别 在 于 Memcached 
是 分 布 式 的 ， 也 就 是 说 它 不 是 本 地 的 。 它 基于 网 络 连 接 方式 完成 服务 ， 本 身 它 是 一 个 独立 于 应 
用 的 程序 或 守护 进程 。 

Memcached 使 用 libevent 库 实现 网 络 连接 服务 ， 理 论 上 可 以 处 理 无 限 多 的 连接 ， 但 是 它 和 
Apache 不 同 ， 它 更 多 的 时 候 是 面向 稳定 的 持续 连接 的 ， 所 以 它 实际 的 并 发 能 力 是 有 限制 的 。 
Memcached 内 存 使 用 方式 也 和 APC 不 同 。 后 者 是 基于 共享 内 存 和 MMAP 的 ， Memcached 有 自 
己 的 内 存 分 配 算法 和 管理 方式 ， 它 和 共享 内 存 没 有 关系 ， 也 没有 共享 内 存 的 限制 。 

正如 所 有 的 NoSQL 数据 库 一 样 ，Memcached 也 有 其 特定 的 应 用 场合 。Memcached 常 作为 
数据 库 前 段 Cache 使 用 。 因 为 它 比 数据 库 少 了 很 多 SQL 解析 、 磁 盘 操 作 等 开销 ， 而 且 它 是 使 用 
内 存 来 管理 数据 的 ， 所 以 它 可 以 提供 比 直接 读 取 数 据 库 更 好 的 性 能 。 另 外 ，Memcached 也 常 作 
为 服务 器 直接 数据 共享 的 存储 媒介 , 例如 SSO 系统 中 保持 系统 单 点 登录 状态 的 数据 就 可 以 保持 
在 Memcached 中 ， 被 多 个 应 用 共享 。 

【 例 12.2】 下 面 是 一 段 简 单 的 测试 代码 ， 代 码 中 对 标识 符 为 'mykey' 的 对 象 数据 进行 存 取 
操作 。PHP 客户 端 在 与 Memcached 服务 建立 连接 之 后 ， 接 下 来 的 事情 就 是 存 取 对 象 了 ， 每 个 
被 存 取 的 对 象 都 有 一 个 唯一 的 标识 符 key， 存 取 操 作 均 通过 这 个 key 进行 , 保存 到 Memcached 
中 的 对 象 实际 上 是 放置 内 存 中 的 ， 并 不 是 保存 在 cache 文件 中 的 ， 这 也 是 为 什么 Memcached 
能 够 如 此 高 效 快速 的 原因 。 


<?php 
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// 包含 Memcached 类 文件 
Tequire_once(memcached-client.php') ; 
/ 选项 设置 


$options=array( 


'servers'=>array('192.168.1.1:11211') ， // Memcached 服务 的 地 址 、 端口 , 可 用 多 个 数组 元 素 表示 多 个 


'debug'=>true, 
'compress_threshold'=>10240, 
‘persistant'=>false 
) ; 
// 创建 Memcached 对 象 实例 
$mc=newmemcached ($options) ; 
/ 设置 此 脚本 使 用 的 唯一 标识 符 
$key=mykey'; 
// 往 Memcached 中 写 入 对 象 


$mc->add (S$key,'somerandomstrings') ; 


$val=$mc->get ($key) ; 
echo"n".str pad ('$mc->add () ,60，)) 
var_dump (S$val) ; 


/ 替换 已 写 入 的 对 象 数据 值 


Memcached 服务 
// 是 否 打 开 debug 
// 超 过 多 少 字 节 的 数据 时 进行 压 
// 是 否 使 用 持久 连接 


全 


nn 


$mce->replace (S$key,array ('some'=>'haha','array'=>'xXXX')) ; 


$val=$mc->get ($key) ; 


echo"n".str pad 〈'$mc->replace () ',60, ") ."n"; 


Var dump ($val) ; 

// 删除 Memcached 中 的 对 象 
$mc->delete ($key) ; 
$val=$mc->get ($key) ; 


echo"n".str pad ('$mc->delete () ,60，)) ."n"; 


var dump ($val) ; 


> 


在 实际 应 用 中 ， 通 常会 把 数据 库 查 询 的 结果 集 保存 到 Memcached 上 


Memcached 中 获取 ,而 不 再 做 数据 


库 查询 操作 ,这样 可 以 在 很 大 程度 上 减轻 数据 


Fh， 下 次 访问 时 直接 从 


库 的 负担 。 通 
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常会 将 SQL 语句 md50 之 后 的 值 作为 唯一 标识 符 key。 下边 是 一 个 利用 Memcached 来 缓存 数据 
库 查询 结果 集 的 示例 (此 代码 片段 紧 接 上 边 的 示例 代码 ): 


<?php 
$sql='SELECT*FROMusers'; 
Skey=md5 ($sql) ; /Memcached 对 象 标识 符 
if (! ($datas=$mc->get ($key))) { 
/ 在 Memcached 中 未 获取 到 缓存 数据 ， 则 使 用 数据 库 查询 获取 记录 和 集 
echo"n".str pad ('ReaddatasfromMySQL.',60, ") ."n"; 
$conn=mysql_connect ('localhost','test','test') ; 
mysql_select db ('test') ; 
$result=mysql_query ($sql) ; 
While ($row=mysql fetch_object ($result)) 
S$datas[]=$row; 
/ 将 数据 库 中 获取 到 的 结果 集 数据 保存 到 Memcached 中 ， 以 供 下 次 访问 时 使 
$mc->add (S$key,S$datas) ; 
}else{ 
echo"n".str pad 〈('Readdatasfrommemcached.,60，') ."n"; 


} 
var dump ($datas) ; 


?> 


可 以 看 出 ， 使 用 Memcached 之 后 ， 可 以 减少 数据 库 连 接 、 查 询 操作 ， 数 据 库 负载 下 来 了 ， 
脚本 的 运行 速度 也 提高 了 。 

(2) Redis。Redis 也 是 一 个 键 值 类 型 的 内 存 数 据 库 ， 属 于 临时 和 永久 兼 具 类 型 ， 有 点 像 
Memcached， 整 个 数据 库 统统 加 载 在 内 存 当 中 进行 操作 ， 但 是 通过 定期 异步 操作 把 数据 库 数 据 
flush 到 硬盘 上 进行 保存 。 因 为 是 纯 内 存 操 作 ，Redis 的 性 能 非常 出 色 ， 每 秒 可 以 处 理 超过 10 万 
次 读 写 操作 。 

Redis 的 出 色 之 处 不 仅仅 是 性 能 ，Redis 最 大 的 魅力 是 支持 保存 List 链表 和 Set 集合 的 数据 
结构 ， 而 且 还 支持 对 List 进行 各 种 操作 。 此 外 单个 value 的 最 大 限制 是 1GB， 不 像 Memcached 
只 能 保存 1MB 的 数据 。 

Redis 的 主要 缺点 是 数据 库容 易 受 到 物理 内 存 的 限制 ， 不 能 用 作 海 量 数据 的 高 性 能 读 写 ， 
并 且 它 没有 原生 的 可 扩展 机 制 , 不 具有 扩展 能 力 , 要 依赖 客户 端 来 实现 分 布 式 读 写 , 因此 Redis 
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适合 的 场景 主要 局 限 在 较 小 数据 量 的 高 性 能 操作 和 运算 上 。 
3， 列 存储 


传统 的 关系 型 数据 库 都 是 以 行为 单位 来 进行 数据 的 存储 的 ， 擅 长 进行 以 行为 单位 的 数据 处 
理 ， 比 如 特定 条 件数 据 的 获取 。 因 此 ， 关 系 型 数据 库 也 被 称 为 面向 行 的 数据 库 。 相 反 ， 面 向 列 
的 数据 库 是 以 列 作为 单位 来 进行 数据 的 存储 的 ， 擅 长 进行 以 列 为 单位 的 数据 处 理 。 表 12-9 所 示 


为 面向 行 和 面向 列 的 数据 库 的 比较 。 
表 12-9 面向 行 和 面向 列 的 数据 库 比较 
数据 存储 方式 特点 
面向 行 的 数据 库 以 行为 单位 进行 存储 对 少量 行进 行 数据 读 取 和 更 新 


对 大 量 行 少数 列 进行 读 取 ， 对 所 有 


面向 列 的 数据 库 以 列 为 单位 进行 存储 行 的 指定 列 进行 同时 更 新 


面向 列 的 数据 库 具 有 高 扩展 性 ， 即 使 数据 增加 也 不 会 降低 相应 的 处 理 速度 ， 所 以 它 主 要 应 
用 于 需要 处 理 大 量 数据 的 情况 。 另 外 ， 利 用 面向 列 的 数据 库 的 优势 ， 把 它 作 为 批 处 理 程序 的 存 
储 器 来 对 大 量 数 据 进行 更 新 也 是 非常 有 用 的 。 

列 存储 数据 库 ， 主 要 产品 有 Google 的 Bigtable、 由 Bigtable 衍生 的 Hypertable 和 HBase、 
Cassandra 这 几 个 数据 库 。 

1) Bigtable 

在 过 去 数 年 中 ，Google 为 在 PC 集群 上 运行 的 可 伸缩 计算 基础 设施 设计 建造 了 三 个 关键 部 
分 。 第 一 个 关键 的 基本 设施 是 Google File System (GFS)， 这 是 一 个 高 可 用 的 文件 系统 ， 提 供 
了 一 个 全 局 的 命名 空间 。 它 通过 扩 机 器 的 文件 数据 复制 来 达到 高 可 用 性 ， 并 因此 免 受 传统 文件 
系统 无 法 避免 的 许多 失败 的 影响 ， 比 如 电源 、 内 存 和 网 络 端口 等 失败 。 第 二 个 基础 设施 是 名 为 
Map-Reduce 的 计算 框架 ， 它 与 GFS 紧密 协作 ， 帮 助 处 理 收集 到 的 海量 数据 。 第 三 个 基础 设施 
就 是 Bigtable， 它 是 传统 数据 库 的 替代 。Bigtable 让 你 可 以 通过 一 些 主键 来 组 织 海 量 数据 ， 并 实 
现 高 效 的 查询 。Bigtable 的 具体 细节 在 12.6.2 节 中 已 有 所 叙述 ， 在 此 不 再 袭 述 。 

2) Hypertable 

Hypertable 是 一 个 开源 、 高 性 能 、 可 伸缩 的 数据 库 ， 是 Bigtable 的 一 个 开源 实现 ， 它 采用 
与 Google 的 Bigtable 相似 的 模型 。 

3) HBase 

HBase， 即 Hadoop Database， 是 一 个 高 可 靠 性 、 高 性 能 、 面 向 列 、 可 伸缩 的 分 布 式 存储 系 
统 ， 利 用 HBase 技术 可 在 廉价 PC Server 上 搭建 起 大 规模 结构 化 存储 集群 。 


和 
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HBase 同 Hypertable 一 样 ， 是 Google Bigtable 的 开源 实现 ， 类 似 Google Bigtable 利用 GFS 

作为 其 文件 存储 系统 。 HBase 利用 Hadoop HDFS 作为 其 文件 存储 系统 ; Google 运行 MapReduce 
来 处 理 Bigtable 中 的 海量 数据 ，HBase 同样 利用 Hadoop MapReduce 来 处 理 HBase 中 的 海量 数 
据 ; Google Bigtable 利用 Chubby 作为 协同 服务 ，HBase 利用 Zookeeper 作为 对 应 。 
图 12-18 描述 了 Hadoop EcoSystem 中 的 各 层 系统 , 其 中 HBase 位 于 结构 化 存储 层 , Hadoop 
HDFS 为 HBase 提供 了 高 可 靠 性 的 底层 存储 支持 ，Hadoop MapReduce 为 HBase 提供 了 高 性 能 
的 计算 能 力 ，Zookeeper 为 HBase 提供 了 稳定 服务 和 failover 机 制 。 另 外 ，Pig 和 Hive 为 HBase 
提供 了 高 层 语言 支持 ， 使 得 在 HBase 上 进行 数据 统计 处 理 变 得 非常 简单 。Sqoop 则 为 HBase 提 
供 了 方便 的 RDBMS 数据 导入 功能 ， 使 得 传统 数据 库 数据 向 HBase 中 迁移 变 得 非常 方便 。 


The Hadoop Ecosystem 


Pig(Data Flow) | Hive(SQL) Sqoop 


四 MapReduce( 作 业 调 度 /执行 系统 ) | | 县 
| 四 
8 Hbase( 列 DB) | 豆 
| < 
HDFS 
CHadoop 分 布 式 文件 系统 ) 


图 12-18 ”Hadoop Ecosystem 各 层 系统 


4) Cassandra 

Cassandra 最 初 由 Facebook 开发 ， 用 于 存储 特别 大 的 数据 ， 是 一 套 开源 的 分 布 式 数据 库 ， 
结合 了 Dynamo 的 键 值 与 Bigtable 的 面向 列 的 特点 。 它 是 一 个 混合 型 的 NoSQL 数据 库 , 其 主要 
功能 比 键 值 存储 Dynamo 更 丰富 ， 但 支持 力度 却 并 不 如 文档 存储 MongoDB。 它 的 主要 特性 是 : 
分 布 式 、 基 于 column 的 结构 化 、 高 扩展 性 。 

Cassandra 是 一 个 网 络 社交 云 计算 方面 理想 的 数据 库 。 以 Amazon 专 有 的 完全 分 布 式 的 
Dynamo 为 基础 ， 结 合 了 Google Bigtable 基于 列 族 的 数据 模型 ，P2P 去 中 心 化 的 存储 。 故 很 多 
方面 都 可 以 称 之 为 Dynamo 2.0。 

Cassandra 的 主要 特点 就 是 它 不 是 一 个 数据 库 ， 而 是 由 一 堆 数 据 库 节点 共同 构成 的 一 个 分 
布 式 网 络 服务 , 对 Cassandra 的 一 个 写 操作 , 会 被 复制 到 其 他 节点 上 去 , 对 Cassandra 的 读 操 作 ， 
也 会 被 路 由 到 某 个 节点 上 面 去 读 取 。 对 于 一 个 Cassandra 群集 来 说 ， 扩 展 性 能 是 比较 简单 的 事 


情 ， 只 管 在 群集 里 面 添加 节点 就 可 以 了 。 和 其 他 数据 库 比 较 ， 其 突出 特点 是 : 模式 灵活 、 真 正 
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的 扩展 性 、 多 数据 中 心 识 别 、 范 围 查询 、 列 表 数 据 结构 、 分 布 式 写 操作 。 
Cassandra 的 目的 是 满足 大 数据 量 、 大 量 随机 的 读 写 操作 应 用 场景 下 的 数据 存储 需求 ， 更 
是 用 于 实时 事务 处 理 和 提供 交互 型 数据 的 应 用 。 


4. 图 存储 


图 存储 在 那些 需要 分 析 对 象 之 间 的 关系 或 者 通过 一 个 特定 的 方式 访问 图 中 所 有 节点 的 应 
用 中 尤为 重要 。 图 存储 针对 有 效 存储 图 节点 和 联系 进行 了 优化 ， 让 你 可 以 对 这 些 图 结构 进行 查 
询 。 图 数据 库 对 于 那些 对 象 之 间 具 有 复杂 关系 的 业务 问题 很 有 用 ， 如 社交 网 络 、 规 则 引擎 、 生 
成 组 合 和 那些 需要 快速 分 析 复杂 网 络 结 果 并 从 中 找 出 模式 的 图 系统 。 
图 存储 是 一 个 包含 一 连 串 的 节点 和 关系 的 系统 ， 当 它们 结合 在 一 起 时 ， 就 构成 了 一 个 图 。 
图 存储 有 三 个 字段 : 节点 、 关 系 和 属性 。 图 节点 通常 是 现实 世界 中 对 象 的 表现 ， 如 人 人 名、 组织 、 
电话 号 码 、 网 页 或 计算 机 节点 。 而 关系 可 以 被 认为 是 这 些 对 象 之 间 的 联系 ， 通 常 被 表示 为 图 中 
两 个 节点 之 间 连 接线 。 如 图 12-19 是 “ 王 大 志 ” 这 个 人 的 社交 网 路 示意 图 ， 从 图 中 可 以 看 出 与 
他 建立 直接 或 者 间接 联系 的 朋友 的 数量 ， 以 及 不 同 朋 友之 间 的 紧密 程度 。 可 以 通过 图 存储 完成 
下 面 典型 的 查询 : 


王 大 志 SS 


12-19 “ 王 大 志 ” 的 社交 网 络 示意 图 


。 图 中 两 个 节点 之 间 的 最 短路 径 是 什么 ? 


第 12 章 “数据库 发 展 和 新 技术 “国医 


。 有 特定 属性 的 节点 的 邻居 节点 是 什么 ? 

。 给 定 图 中 任意 两 个 节点 ， 它 们 的 邻居 节点 有 多 相似 ? 

。 图 中 不 同 点 与 其 他 点 的 平均 连接 数 是 多 少 ? 

如 果 图 存储 的 节点 众多 、 关 系 复杂 、 属 性 很 多 ， 那么 传统 的 关系 型 数据 库 将 要 建 很 多 大 型 
的 表 ， 并 且 表 的 很 多 列 可 能 是 空 的 ,在 查询 时 还 极 有 可 能 进行 多 重 SQL 语句 的 嵌 套 。 可 是 图 存 
储 就 可 以 很 优异 ， 基 于 图 的 很 多 高 效 的 算法 可 以 大 大 提高 执行 效率 。 

现 总 结 一 下 图 数据 库 和 传统 的 关系 型 数据 库 在 一 些 问 题 处 理 上 的 不 同 ， 见 表 12-10。 


表 12-10 ”图 数据 库 和 传统 的 关系 型 数据 库 操作 的 不 同 


操作 关系 型 数据 库 数 据 库 
查询 根据 索引 或 逐条 查询 采用 图 的 算法 


事件 处 理 | 不 能 将 事件 通知 到 外 部 程序 有 监听 接口 可 供 外 部 程序 监听 
只 能 对 表 或 视图 创建 索引 ， 数 据 量 一 | 可 以 创建 只 适用 于 图 数据 的 “位 置 ? 索 引 ，“ 特 性 ” 
大 ， 则 效率 迅速 下 降 索引 , “对象 数据 ”索引 等 ， 且 性 能 高 效 


创建 索引 


在 很 长 一 段 时 间 里 ， 图 数据 库 只 局 限 在 学 术 圈子 中 ， 直 到 电子 商务 的 业务 模型 逐渐 成 熟 ， 
挖掘 用 户 的 潜在 喜好 商品 ， 并 大 量 使 用 相关 的 挖掘 算法 ， 才 使 得 图 数据 库 逐 渐 “ 走 出 来 ” 目 
前 常见 的 一 些 图 数据 库 如 表 12-11 所 示 。 


表 12-11 常见 的 图 数据 库 


AllegroGraph SPARQL 


Java 


其 中 ， 比 较 成 熟 的 是 Twitter 的 FlockDB。FlockDB 是 一 个 分 布 式 的 图 数据 库 ， 但 是 它 并 没 
有 优化 遍历 图 的 操作 。 它 优化 的 操作 包括 : 超大 规模 邻接 矩阵 查询 ， 快 速 读 写 和 可 分 页 查询 ; 
它 主 要 是 要 解决 可 伸缩 性 的 问题 ， 通 俗 点 说 就 是 通过 增加 服务 器 就 能 解决 用 户 量 上 升 造成 的 访 


问 压 力 ， 而 不 需要 在 软件 上 做 大 的 变动 。FlockDB 将 图 存储 为 一 个 边 的 集合 ， 每 条 边 用 两 个 代 
表 顶 点 的 64 位 整数 表示 。 对 于 一 个 社会 化 网 络 图 ， 这 些 顶 点 ID 即 用 户 ID， 但 是 对 于 “收藏 ” 
推 文 这 样 的 边 ， 其 目标 顶点 (Destination ID) 则 是 一 条 推 文 的 ID。 每 一 条 边 都 被 一 个 64 位 的 
位 置信 息 标识 ， 用 于 排序 。(Twitter 在 “关注 ”类 的 边 上 用 了 时 间 戳 标识 ， 所 以 如 果 你 的 关注 
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者 列表 是 按时 间 排 序 的 ， 那 么 总 是 最 新 的 在 最 前 面 。》 

对 于 一 条 复杂 的 查询 , 通常 会 被 分 解 成 一 些 单 用 户 查询 ,并 很 快 响 应 。 数据 根据 节点 分 块 ， 
所 以 这 些 查 询 能 分 别 在 各 自 的 数据 块 ， 通 过 一 个 索引 过 的 范围 查询 得 到 结果 。 类 似 地 ， 遍 历 一 
个 长 结果 集 是 用 位 置 作为 游标 ， 而 不 是 用 LIMIT/OFFSET， 所 有 页 的 数据 均 被 索引 ， 访 问 一 
样 快 。 

Neo4j 也 是 一 个 典型 的 图 数据 库 。 它 提供 了 大 规模 可 扩展 性 ， 在 一 台 机 器 上 可 以 处 理 数 十 
亿 节 点 /关系 /属性 的 图 像 ， 可 以 扩展 到 多 台 机 器 并 行 运行 。 相 对 于 关系 数据 库 来 说 ， 图 数据 库 
善于 处 理 大 量 复杂 、 互 连接 、 低 结构 化 的 数据 ， 这 些 数据 变化 迅速 ， 需 要 频繁 的 查询 。 在 关系 
数据 库 中 ， 这 些 查 询 会 导致 大 量 的 表 连 接 ， 因 此 会 产生 性 能 上 的 问题 。Neo4j 重点 解决 了 拥有 
大 量 连 接 的 传统 RDBMS 在 查询 时 出 现 的 性 能 衰退 问题 。 通 过 围绕 图 进行 数据 建 模 ，Neo4j 会 
以 相同 的 速度 遍历 节点 与 边 ， 其 遍历 速度 与 构成 图 的 数据 量 没有 任何 关系 。 此 外 ，Neo4j 还 提 
供 了 非常 快 的 图 算法 、 推 荐 系统 和 OLAP 风格 的 分 析 ， 而 这 一 切 在 目前 的 RDBMS 系统 中 都 是 
无 法 实现 的 。 

5， 多 值 数据 库 


多 值 数据 库 系 统 是 分 布 式 数据 库 系 统 的 重要 分 支 。 它 速度 快 ， 体 积 小 ， 比 关系 数据 库 便宜 
而 很 快 得 到 了 认可 。 它 提供 了 一 个 通用 的 数据 集成 与 访问 平台 ， 屏 蔽 了 现 有 各 数据 库 系统 不 同 
的 访问 方法 和 用 户 界面 ， 给 用 户 呈 现 出 一 个 访问 多 种 数据 库 的 公共 接口 。 多 值 数据 库 系统 使 用 
的 多 个 异 构 的 数据 源 之 间 可 以 共享 它们 相互 依赖 的 数据 ， 并 具有 相互 操作 的 能 力 。 这 种 技术 将 
在 电子 政务 、 电 子 商务 、 企 业 信息 集成 、 军 事 指挥 、 金 融 证 券 、 办 公 自 动 化 、 远 程 教育 、 远 程 
医疗 等 领域 发 挥 巨大 的 支撑 作用 。 

常见 的 多 值 数 据 库 有 Rocket U2、Extensible Storage Engin (ESE/NT)、OpenInsight 和 openQM 等 。 

其 中 ，Rocket U2 包含 了 UniData 和 UniVerse 两 个 扩充 型 关系 型 数据 库 ， 采 用 多 键 值 存储 ， 
支持 嵌入 式 实体 ， 虚 拟 元 数据 ， 具 有 .NET、socket 和 Java 的 API， 具 有 针对 快速 、 经 济 、 垂 直 
应 用 开发 的 集成 式 开发 环境 。 

ESE 是 一 种 非 关 系 型 代 入 式 数 据 库 引 擎 ， 适 用 于 那些 需要 高 性 能 、 较 小 存储 空间 支出 的 应 
用 。ESENT 已 经 应 用 于 Windows Desktop Search、Windows Live Mail 等 多 个 微软 产品 中 。 它 有 
高 并 发 的 数据 库 访 问 ， 灵 活 的 元 数据 定义 〈 表 、 列 、 索 引 )， 支 持 整 型 、 浮 点 型 、 字 符 型 、 二 
进 制 列 的 索引 等 特点 。 

OpenInsight 采用 TCP/IP 协议 、 命 名 管道 的 体系 结构 、 支 持 远 程 登 录 ， 采 用 关系 的 或 多 键 
值 存储 ， 支 持 嵌 套 实体 ， 在 关系 型 的 存储 结构 中 ， 表 的 行 和 大 小 可 动态 改变 。 
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OpenQM 的 商业 版 本 支持 Windows，Linux (RedHat，Fedora，Debian，Ubuntu)，FreeBSD， 
Mac OS X 和 Windows Mobile 等 ,商业 版 本 包括 一 个 GUI 管理 界面 和 终端 模拟 器 ,但 开源 版 本 
仅 包括 核心 多 值 数 据 库 引 擎 ， 主 要 是 为 开发 人 员 准 备 的 。OpenQM 支持 嵌 套 数据 ， 能 够 高 度 自 
动 化 地 分 配 表 空 间 ， 通 过 多 种 锁 机 制 来 控制 并 行 计 算 ， 采 用 QMBasic 集 成 了 面向 对 象 的 编程 
机 制 ) 来 进行 快速 开发 。 
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产权 基础 知识 
本 章 主要 介绍 标准 化 、 知 识 产 权 基 础 知识 ， 重 点 对 软件 著作 权 、 商 业 秘密 权 、 专 利 权 和 商 


标 权 进 行 了 阐述 。 
13.1 标准 化 基础 知识 


13.1.1 标准 化 的 基本 概念 


1. 标准 、 标 准 化 的 概念 


标准 〈Standard) 是 对 重复 性 事物 和 概念 所 做 的 统一 规定 。 规 范 、 规 程 都 是 标准 的 一 种 形式 。 

标准 化 (Standardization) 是 在 经 济 、 技 术 、 科 学 及 管理 等 社会 实践 中 ， 以 改进 产品 、 过 程 
和 服务 的 适用 性 ， 防 止 贸 易 壁 垒 ， 促 进 技术 合作 ， 促 进 最 大 社会 效益 为 目的 ， 对 重复 性 事物 和 
概念 通过 制定 、 发 布 和 实施 标准 达到 统一 ， 获 最 佳 秩序 和 社会 效益 的 过 程 。 


2. 标准 化 的 范围 和 对 象 


标准 化 涉及 的 范围 包括 生产 、 经 济 、 技 术 、 科 学 及 管理 等 社会 实践 中 具有 的 重复 性 事物 和 
概念 以 及 需要 建立 统一 技术 要 求 的 各 个 领域 。 在 这 些 领域 中 ， 凡 具有 多 次 重复 使 用 和 需要 制定 
标准 的 具体 产品 ， 以 及 各 种 定额 、 规 划 、 要 求 、 方 法 和 概念 等 ， 都 可 称 为 标准 化 的 对 象 。 如 产 
品 的 品种 、 规 格 、 形 式 ; 包装 的 尺寸 、 材 质 、 样 式 ， 信息 表 示 、 信 息 处 理 技术 ;试验 方法 、 检 
验方 法 、 操 作 方法 和 抽样 方法 等 ， 量 值 、 单 位 、 术 语 、 符 号 、 代 码 、 标 志 ， 市 场 调查 、 研 制 
发 、 物 资 采购 、 加 工 工艺 、 质 量 控制 、 质 量 检验 、 销 售 、 售 后 服务 等 各 阶段 的 管理 事项 ， 等 等 。 

标准 化 对 象 一 般 可 分 为 两 大 类 ， 一 类 是 标准 化 的 具体 对 象 ， 即 需要 制定 标准 的 具体 事物 ; 
另 一 类 是 标准 化 的 总 体 对 象 ， 即 各 种 具体 对 象 的 全 体 所 构成 的 整体 ， 通 过 它 可 以 研究 各 种 具体 
对 象 的 共同 属性 、 本 质 和 普遍 规律 。 


3， 标准 化 过 程 模式 


标准 是 标准 化 活动 的 产物 ， 其 目的 和 作用 都 是 通过 制定 和 贯彻 具体 的 标准 来 体现 的 。 标 准 
化 不 是 一 个 孤立 的 事物 ,而 是 一 个 活动 过 程 。 标 准 化 活动 过 程 一 般 包 括 标准 产生 (调查 、 研究 、 


4. 标准 的 分 类 
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形成 草案 、 批 准 发 布 ) 子 过 程 、 标 准 实施 宣传、 普及、 监督 、 咨 询 ) 子 过 程 和 标准 更 新 〈 复 
审 、 废 止 或 修订 ) 子 过程 等 。 


标准 化 工作 是 一 项 复杂 的 系统 工程 ， 标 准 为 适应 不 同 的 要 求 从 而 构成 一 个 庞大 而 复杂 的 系 


统 ， 为 便于 研究 和 应 


用 的 目的 ， 可 以 从 不 同 的 角度 和 属性 将 标准 进行 分 类 。 通 常 可 从 标准 适用 


范围 、 标 准 的 性 质 、 标 准 的 对 象 和 作用 以 及 根据 法 律 的 约束 性 进行 分 类 。 本 书 仅 介 绍 根据 标准 
制定 的 机 构 和 标准 适用 的 范围 分 类 。 

根据 标准 制定 的 机 构 和 标准 适用 的 范围 可 分 为 国际 标准 、 国 家 标准 、 行 业 标准 、 企 业 〈 机 
构 ) 标准 及 项 目 〈 课 题 ) 标准。 

(1) 国际 标准 〈International Standard)。 国 际 标准 是 指 国际 标准 化 组 织 (ISO)、 国 际 电 工 
委员 会 (IEC) 所 制定 的 标准 ， 以 及 ISO 出 版 的 《国际 标准 题 内 关键 词 索引 (KWIC Index)》 中 
收录 的 其 他 国际 组 织 制定 的 标准 。 国 际 标准 在 世界 范围 内 统一 使 用 ， 各 国 可 以 自愿 采用 ， 不 强 


制 使 用 ， 但 由 于 国际 标准 集中 了 一 些 先进 工业 国家 的 技术 经 验 ， 各 个 国家 为 外 贸 上 的 利益 和 本 
国 利益 考虑 往往 都 积极 采用 国际 标准 。 


(2) 国家 标准 (National Standard)。 国 家 标准 是 由 政府 或 国家 级 的 机 构 制 定 或 批准 的 、 
适用 于 全 国 范围 的 标准 ， 是 一 个 国家 标准 体系 的 主体 和 基础 ， 国 内 各 级 标准 必须 服从 且 不 


得 与 之 相抵 触 。 常 见 


的 国家 标准 如 表 13-1 所 示 。 
表 13-1 常见 的 国家 标准 
说 明 
ph 华 人 民 共 和 国 国 家 技术 监督 局 所 公布 实施 的 标准 ， 简 称 为 “国标 ” 


(3) 区 域 标准 (Regional Standard) 也 称 地 区 标准 ， 泛 指 世界 上 按 地 理 、 经 济 或 政治 划分 的 
某 一 区 域 标准 化 团体 所 通过 的 标准 。 它 是 为 了 某 一 区 域 的 利益 建立 的 标准 。 太 平 洋 地 区 标准 会 
议 〈PASC)、 欧 洲 标准 化 委员 会 CEN)、 亚 洲 标准 咨询 委员 会 ASAC)、 非 洲 地 区 标准 化 组 


织 (ARSO) 等 地 区 组 
(4) 行业 标准 (Specialized Standard)。 由 行业 机 构 、 学 术 团体 或 国防 机 构 制定 ， 并 适用 于 
某 个 业务 领域 的 标准 。 


织 所 制定 和 使 用 的 标准 都 是 区 域 标准 。 


例如 : 中 华人 民 共和 国 国家 军用 标准 (GJB)、 美 国电 气 和 电子 工程 师 学 


会 标准 (IEEE)、 美 


防 部 标准 (Department Of Defense-Standards，DOD-STD )。 


(5) 企业 标准 〈Company Standard)。 由 企业 或 公司 批准 、 发 布 的 标准 ， 某 些 产品 标准 由 其 
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E 管 机 构 批 准 、 发 布 。 例 如 ， 美 国 IBM 公司 通用 产品 部 (General Products Division ) 1984 
FE 制 定 的 “程序 设计 开发 指南 ”， 仅 供 该 公司 内 部 使 用 。 

标准 化 法 》 的 规定 ,我 国标 准 分 为 国家 标准 、 行 业 标准 、 地 方 标准 和 


上 级 
P 华 人民 共 和 国 
企业 标准 4 类。 这 4 类 标准 主要 是 适用 的 范围 不 同 ， 不 是 标准 技术 水 平 高 低 的 分 级 。 


自 


根据 《中 
5. 标准 的 代号 和 编号 
1) 国际 标准 ISO 的 代号 和 编号 
国际 标准 ISO 的 代号 和 编号 的 格式 为 : ISO+ 标 准 号 +[ 杠 + 分 标准 号 ]+ 冒 号 + 发 布 年 号 ( 方 括 
号 中 的 内 容 可 有 可 无 )， 例 如 ，ISO8402: 1987 和 ISO9000-1: 1994 是 ISO 标准 的 代号 和 编号 。 
家 标准 的 编号 
家 标准 的 代号 、 标 准 发 布 顺序 号 和 标准 发 布 年 代号 〈4 位 数 ) 组 成 。 
例如 ， 我 国 强制 性 国家 标准 : GB XXXXX-XXXX; 推荐 性 国家 标准 : GB/T XXXXX-XXXX。 


2) 国 


家 标准 的 编号 由 国 


国 


3) 行业 标准 的 编号 
行业 标准 的 编号 由 行业 标准 代号 、 标 准 发 布 顺序 及 标准 发 布 年 代号 〈4 位 数 ) 组 成 。 已 了 
式 公布 的 行业 代号 有 QJ (航天 )、SJ (电子 )、JB 机械) 和 要 金融 系统 ) 等 。 例 如 ， 航 天 


强制 性 标准 编号 :QJ XXXX-XXXX; 航天 推荐 性 标准 编号 : QJ/T XXXX-XXXX。 
地 方 标准 的 编号 由 地 方 标准 代号 、 地 方 标准 发 布 顺序 号 和 标准 发 布 年 代号 〈4 位 数 ) 三 部 
区 划 代 码 的 

和 的 强制 性 地 方 标准 


4) 地 方 标准 的 编号 
分 组 成 。 其 中 ， 地 方 标准 的 代号 由 大 写 汉语 拼音 DB 加 上 省 、 自 治 区 、 直 辖 市 行政 


前 两 位 数字 (如 北京 市 11、 天 津 市 12、 上 海 市 31 等 ) 组 成 。 例 如 ， 北 京 让 
编号 : DB11 XXX-XXXX; 北京 市 的 推荐 性 地 方 标准 编号 : DB11/T XXX-XXXX。 
有 大写 拼音 


5) 企业 标准 的 编号 

企业 标准 的 编号 由 企业 标准 代号 、 标 准 发 布 顺 序号 和 标准 发 布 年 代号 (4 位 数 ) 组 成 。 其 
中 ,企业 标准 的 代号 由 汉语 大 写 拼音 字母 Q 加 斜 线 再 加 企业 代号 组 成 ， 企 业 代 号 可 
字母 、 阿 拉 伯 数 字 或 两 者 兼用 组 成 。 企 业 标准 一 经 制定 颁布 ， 即 对 整个 企业 具有 约束 性 ， 是 企 


国际 标 


业 法 规 性 文件 ， 没 有 强制 性 企业 标准 和 推荐 性 企业 标准 之 分 。 


[委员 会 所 制定 的 标准 ， 以 及 ISO 出 版 的 《 
家 标准 和 通行 的 


6. 国际 标准 和 国外 先进 标准 
国际 标准 是 指 国际 标准 化 组 织 、 国 际 电 了 
准 题 内 关键 词 索引 (KWIC Index)》 中 收录 的 其 他 国 
国外 先进 标准 是 指 国际 上 有 权威 的 区 域 性 标准 ;世界 上 经 济 发 达 国 家 的 
团体 标准 ; 包括 知名 企业 标准 在 内 的 其 他 国际 上 公认 的 先进 标准 。 


际 组 织 制定 的 标准 。 
于 
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采用 国际 标准 或 国外 先进 标准 应 按 国 家 标准 GB161 的 规定 编写 。 根 据 采用 国际 标准 或 国外 
先进 标准 的 程度 ， 分 为 等 同 采用 、 等 效 采用 和 非 等 效 采 用 。 采 用 程度 符号 缩写 字母 表示 ， 等 同 
采用 idt 或 IDT 表示 ， 等 效 采用 eqv 或 EQV 表示 ， 非 等 效 采 用 neq 或 NEQ 表示 。 例 如 : 
Q@ 等 同 采用 : GB XXXX 一 XXXX (idt ISO XXXX--XXXX)。 
@ 等 效 采 用 : GB XXXX 一 XXXX (eqv ISO XXXX— XXXX)。 
图 非 等 效 采 用 : GB XXXX 一 XXXX (neq ISOXXXX 一 XXXX)。 


13.1.2 信息 技术 标准 化 


信息 技术 标准 化 是 围绕 信息 技术 开发 、 信 息 产 品 的 研制 和 信息 系统 建设 、 运 行 与 管理 而 开 
展 的 一 系列 标准 化 工作 。 例 如 ， 信 息 技术 术语 、 信 息 表示 、 汉 字 信 息 处 理 技术 、 媒 体 、 软 件 工 
程 、 数 据 库 、 网 络 通信 、 电 子 数据 交换 、 管 理 信息 系统 和 计算 机 辅助 技术 等 方面 的 标准 化 。 


1， 信 息 编 码 标准 化 


编码 是 一 种 信息 表现 形式 。 在 一 定 条 件 下 ， 它 对 事物 或 概念 的 描述 比 自然 语言 要 直接 、 简 
洁 、 准 确 和 有 力 。 编 码 是 一 种 信息 交换 的 技术 手段 。 对 信息 进行 编码 实际 上 是 对 文字 、 音 频 、 
图 形 和 图 像 等 信息 进行 处 理 ， 使 之 量化 ， 从 而 便于 利用 各 种 通信 设备 进行 信息 传递 和 利用 计算 
机 进行 信息 处 理 。 作 为 一 种 信息 交换 的 技术 手段 ， 必 须 保 证 信息 交换 的 一 致 性 。 为 了 统一 编码 

系统 ， 人 们 制定 了 各 种 标准 代码 ， 如 国际 上 较 通用 的 ASCI 码 〈 美 国信 息 交 换 标准 代码 ) 。 


2， 汉 字 编 码 标准 化 


汉字 编码 是 对 每 一 个 汉字 按 一 定 的 规律 用 若干 个 字母 、 数 字 、 符 号 表示 出 来 。 汉 字 编 码 的 
方法 很 多 ， 主 要 有 数字 编码 ， 如 电报 码 、 四 角 号 码 字 典 中 的 汉字 号 码 都 是 用 数字 对 汉字 进行 编 
码 ; 拼音 编码 ， 即 用 汉字 的 拼音 字母 对 汉字 进行 编码 ; 字形 编码 ， 即 用 汉字 的 偏旁 部 首 和 笔划 
结构 与 各 个 英文 字母 相对 应 ， 再 用 英文 字母 的 组 合 代表 相应 的 汉字 。 对 每 一 种 汉字 编码 ， 计 算 
机 内 部 都 有 一 种 相应 的 二 进 制 内 部 码 ， 不 同 的 汉字 编码 ， 在 使 用 上 不 能 替换 。 若 把 各 种 编码 方 
案 都 存 入 计算 机 供 人 们 选择 ， 在 技术 上 和 使 用 效果 上 则 是 困难 的 和 不 经 济 的 。 我 国 在 汉字 编码 
标准 化 方面 取得 的 突出 成 就 就 是 信息 交换 用 汉字 编码 字符 集 国家 标准 的 制定 。 该 字符 集 共 有 6 
集 。 其 中 ，GB 2312 一 80 信息 交换 用 汉字 编码 字符 集 是 基本 集 ， 收 入 常用 基本 汉字 和 字符 7445 
个 。GB 7589 一 87 和 GB 7590 一 87 分 别 是 第 二 辅助 集 和 第 四 辅助 集 ， 各 收入 现代 规范 汉字 7426 
个 。GB/T 12345 一 90 是 辅助 集 ， 它 与 第 三 辅助 集 和 第 五 辅助 集 分 别 是 与 基本 集 、 第 二 辅助 集 和 
第 四 辅助 集 相对 应 的 繁体 字 的 汉字 字符 集 。 除 汉字 编码 标准 化 外 ， 汉 字 信 息 处 理 标准 化 的 内 容 
还 包括 汉字 键盘 输入 的 标准 化 ， 汉 字 文 字 识 别 输入 和 语音 识别 输入 的 标准 化 ， 汉 字 输 出 字体 和 
质量 的 标准 化 ， 汉 字 属 性 和 汉语 词语 的 标准 化 等 。 
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提高 软件 


3. 软件 工程 标准 化 


软件 工程 的 目的 是 改善 软件 开发 的 组 织 ， 降 低 开发 成 本 ， 缩 短 开发 时 间 ， 提 高 ] 
质量 。 它 在 内 容 上 包括 软件 开发 的 软件 概念 形成 、 需 求 分 析 、 计 划 组 织 、 系 统 分 析 与 


[ 作 效 率 ， 


设计 、 结 构 程 序 设计 、 软 件 调试 、 软 件 测试 和 验收 、 安 装 和 检验 、 软 件 运行 和 维护 ， 以 及 软件 


证 了 


[ 作 ， 如 评审 与 审计 、 产 
F 发 变 成 一 种 社会 化 的 软件 生产 方式 。 软 件 生产 
准 化 。 软 件 工 程 标准 的 类 型 也 是 多 方面 的 ， 常 常 是 跨越 软件 4 


手工 的 软件 玫 


运行 的 终止 。 同 时 还 有 许多 技术 管理 工作 ， 如 过 程 管 理 、 产 品 管理 、 资 源 管理 ， 以 及 确认 与 验 
i 品 分 析 等 。 软 件 工程 最 显著 的 特点 就 是 把 个 别 的 、 自 发 的 、 分 散 的 、 
的 社会 化 必然 要 求 软件 工程 实行 标 
E 存 期 各 个 阶段 。 所 有 这 些 方面 都 


应 逐步 建立 标准 或 规范 。 软 件 工程 标准 化 的 主要 内 容 包 括 过 程 标准 〈 如 方法 、 技 术 和 度量 等 入 
产品 标准 ( 刀 


I 需求 、 设 计 、 部 件 、 描 述 、 计 划 和 报告 等 )、 专 业 标准 (如 道德 准则 、 认 证 等 )、 


记 法 标准 (如 术语 、 表 示 法 和 语言 等 )、 开 发 规范 准则、 方法 和 规程 等 )、 文 件 规范 (文件 范 
围 、 文 件 编制 、 文 件 内 容 要 求 、 编 写 提示 )、 维 护 规范 (软件 维护 、 组 织 与 实施 等 ) 以 及 质量 
岗 范 (软件 质量 保证 、 软 件 配 置 管 理 、 软 件 测试 和 软件 验收 等 等 。 
我 国 软件 工程 国家 标准 目录 如 表 13-2 所 示 。 
表 13-2 软件 工程 国家 标准 
序 ”号 | 国家 标准 编号 标准 名 称 
信息 处 理 数据 流程 图 、 程 序 流程 图 、 系 统 流程 图 、 程序 
上 网 络 图 和 系统 资源 图 的 文件 编制 符号 及 约定 
2 GB/T 8566 信息 技术 “软件 生存 周期 过 程 
3 GB/T 8567 计算 机 软件 文档 编制 规范 
4 GB/T 9385 计算 机 软件 需求 说 明 编制 指南 
5 GB/T 9386 计算 机 软件 测试 文件 编制 规范 
6 GB/T 11457 软件 工程 术语 
7 GB/T 13502 信息 处 理 程序 构造 及 其 表示 的 约定 
8 GB/T 14 085 信息 处 理 系 统 计算 机 系统 配置 图 符号 及 其 约定 
9 GB/T 14394 计算 机 软件 可 靠 性 和 维护 性 管理 
10 GB/T 15532 计算 机 软件 单元 测试 
11 GB/T 15535 信息 处 理 ” 单 命中 判定 表 规 范 
12 GB/T 16260.1 软件 工程 产品 质量 第 1 部 分 : 质量 模型 
13 GB/T 16260.2 软件 工程 产品 质量 第 2 部 分 : 外 部 度量 
14 GB/T 16260.3 软件 工程 产品 质量 第 3 部 分 : 内 部 度量 
15 GB/T 16260.4 软件 工程 ”产品 质量 第 4 部 分 : 使 用 质量 的 度量 
16 GB/T 16680 1996 软件 文档 管理 指南 
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续 表 
序 ”号 | 国家 标准 编号 标准 名 称 
17 GB/T 17544 1998 依 息 技术 “软件 包 质量 要 求 和 测试 
18 GB/T 18234 2000 信息 技术 ”CASE 工具 的 评价 与 选择 指南 
要 EA 术 软件 测量 功能 规模 测量 第 1 部 分 : 概念 
20 GB/T 18492 系统 及 软件 完整 性 级 别 
21 GB/Z 18493 软件 生存 周期 过 程 指南 
22 GB/T 18905.1 产品 评价 ”第 1 部 分 : 概述 
23 GB/T 18905.2 ”产品 评价 ”第 2 部 分 : 策划 和 管理 
24 GB/T 18905.3 软件 工程 产品 评价 ”第 3 部 分 ， 开发 者 用 的 过 程 
25 GB/T 18905.4 软件 工程 “产品 评价 “第 4 部分: 需 方 用 的 过 程 
26 GB/T 18905.5 软件 工程 “产品 评价 “第 5 部 分 ， 评价 者 用 的 过 程 
27 GB/T 18905.6 软件 工程 产品 评价 ”第 6 部 分 : 评价 模块 的 文档 编制 
28 GB/Z 18914 信息 技术 软件 工程 CASE 工具 的 采用 指南 
29 GB/Z 20156 软件 工程 软件 生存 周期 过 程 ”用 于 项 目 管理 的 指南 
30 GB/T 20157 软件 工程 软件 维护 
31 GB/T 20158 信息 技术 ”软件 生存 周期 过 程 ”配置 管理 
32 GB/T 20917 软件 工程 “测量 过 程 
33 GB/T 20918 信息 技术 软件 生存 周期 过 程 ”风险 管理 
13.1.3 ”标准 化 组 织 
1， 国际 标准 化 组 织 
ISO 和 IEC 是 世界 上 两 个 最 大 、 最 具有 权威 的 国际 标准 化 组 织 。 目 前 ， 由 ISO 确认 并 公布 
的 国际 标准 化 组 织 还 有 国际 计量 局 〈(BIPM)、 联 合 国教 科 文 组 织 CUNESCO )、 世 界 卫生 组 织 
(WHO)、 世 界 知 识 产权 组 织 〈《WIPO)、 国 际 信息 与 文献 联合 会 (FID) 和 国际 法 制 计量 组 织 
(OIML) 等 27 个 国际 组 织 。 
1) 国际 标准 化 组 织 
际 标准 化 组 织 是 世界 上 最 大 的 、 非 政府 性 的 ， 由 各 国标 准 化 团体 (ISO 成 员 团体 ) 组 成 
的 世界 性 联合 专门 机 构 。 它 成 立 于 1947 年 2 月 ， 其 宗旨 是 在 世界 范围 内 促进 标准 化 工作 的 发 
展 ， 以 利于 国际 资源 的 交流 和 合理 配置 ， 扩 大 各 国 在 知识 、 科 学 、 技 术 和 经 济 领域 的 合作 。 其 
主要 活动 是 制定 国际 标准 ， 协 调 世 界 范 围 内 的 标准 化 工作 ， 组 织 各 成 员 国 和 技术 委员 会 进行 交 
流 ， 以 及 与 其 他 国际 性 组 织 进行 合作 ， 共 同 研究 有 关 标 准 问题 ， 出 版 ISO 国际 标准 。 人 制定 国际 
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标准 的 


关 工作 。 此 外 ，ISO 还 负责 协调 世界 范围 
报 交流 ， 并 和 其 
术 标 准 化 方面 ， 


作 通 常 


他 国 


ISO 的 技术 委员 会 完成 ， 各 成 员 
均 有 权 参 加 该 委员 会 的 工作 。 与 ISO 保持 联系 的 各 


际 性 组 织 保持 联系 和 合作 ， 共 同 
ISO 与 IEC 保持 密切 合 


关系 。 


内 的 标准 化 工作 ， 组 织 各 成 员 


团体 若 对 某 技术 委员 会 确立 的 项 目 感 兴 
国际 组 织 〈 官 方 的 或 非 官方 的 ) 也 可 参加 有 
和 技术 委员 会 进行 情 


是 ISO 常务 机 构 ， 理 事 会 下 设 若干 专门 委员 会 


2) 


国 
并 


出 来 ， 两 组 织 各 
工程 及 电子 领域 


际 
国际 电 了 
经 社 到 


电工 委员 会 


白 


国际 标准 化 


[委员 会 成 立 于 1906 年 ， 是 世界 上 最 早 的 非 政 府 性 国 
E 事 会 (ECOSOC) 的 甲 级 咨询 组 织 。 


国际 标准 化 体系 ， 


作 ， 其 他 领域 则 由 ISO 负责 。 


研究 感 兴趣 的 有 关 标 准 化 问题 。 在 电工 技 
成 员 全 体 大 会 是 ISO 的 最 高 权力 机 构 。 理 


事 会 


际 电 工 标准 化 机 构 ， 是 联合 
自 1947 年 ，ISO 成 立 后 ，IEC 曾 作 为 一 个 电工 部 
入 ISO， 但 在 技术 上 和 财务 上 仍 保持 独立 。1976 年 ， 双 方 又 达成 新 协议 ，IEC 从 ISO 中 分 离 
独立 ， 自 愿 合作 ， 互 为 补充 ， 共 同 建立 


IEC 负责 有 关 电 气 


IEC 的 工作 领域 包括 电工 领域 各 个 方面 ， 如 电力 、 电 子 、 电 信和 原子 能 方面 的 电工 技术 等 。 
2. 区 域 标 准 化 组 织 


布 和 协调 该 地 区 的 标准 。 


(1) 欧洲 标准 化 委员 会 (CEN) 成 立 于 1961 年 ， 是 由 欧洲 经 济 共同 体 (EEC)、 欧 洲 自 
联盟 (EFTA) 所 属国 家 的 标准 化 机 构 所 组 成 ， 主 要 任务 是 协调 各 成 员 国 的 标准 ， 制 定 必要 的 
标准 (EN)， 实 行 

(2) 欧洲 电工 标准 化 委员 会 (CENELEC) 成 立 于 1972 年 ， 是 由 欧洲 电工 标准 协调 委员 会 
昌 工 协调 委员 会 共同 市 场 小 组 (CENELCOM) 合并 组 成 ， 
以 及 电子 元 器 件 质量 认证 ， 制 定 部 分 欧洲 标准 。 

(3) 亚洲 标准 咨询 委员 会 (ASAC) 成 立 于 1967 年 
商 建立 ， 主 要 是 在 ISO、IEC 标准 的 基础 上 ， 协 调 各 成 员 国标 准 化 活动 ， 制 定 

(4) 国际 
黎 成 立 ，1947 年 成 为 联合 
一 个 国际 组 织 ， 研 究 制 定 有 关 电 信 业 务 的 规章 制度 ， 
ITU 的 目的 和 任务 是 维持 和 


洲 


一 


国 


效应 用 


CENEL) 和 欧洲 上 
电器 和 


，Lb 


电子 领域 的 标准 ， 


9 


发 展 


区 域 标准 化 组 织 是 指 同 处 一 个 地 区 的 某 些 


区 域 认 证 制度 。 


提高 电信 业务 的 效率 。 
3. 行业 标准 化 组 织 
行业 标准 化 组 织 是 指 制定 和 公布 适应 


国际 合作 ， 


通过 决议 提出 推荐 标准 ， 
合理 利用 电信 ， 


以 改进 


于 某 个 业务 领域 标准 的 专业 标准 化 团体 ， 


家 组 成 的 标准 化 组 织 ， 其 主要 职能 是 制定 、 发 


惨 量 


主要 是 协调 各 成 员 


FE， 由 联合 国 亚洲 与 太平 洋 经 社 委员 会 协 


区 域 性 标准 。 


电信 联盟 ITU (International Telecommunication Union): ITU 于 1865 年 5 月 在 巴 
的 部 门 机 构 ， 是 世界 各 国政 府 的 电信 主管 部 门 之 间 协 调 电 信和 事务 的 


收集 有 关 情 报 。 


促进 技术 设施 的 发 展 及 有 


以 及 在 其 业 
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务 领 域 开 展 标准 化 工作 的 行业 机 构 、 学 术 团 体 或 国防 机 构 。 

(1) 美国 电气 电子 工程 师 学 会 IEEE (Institute of Electrical and Electronics Engineers) 是 由 
美国 电气 工程 师 学 会 (AIEE) 和 美国 无 线 电工 程 师 学 会 ( 耻 E) 于 1963 年 合并 而 成 ， 是 美国 规 
模 最 大 的 专业 学 会 。IEEE 主要 制定 的 标准 内 容 有 电气 与 电子 设备 、 试 验方 法 、 原 器 件 、 符 号 、 
定义 以 及 测试 方法 等 。 近 年 来 ， 该 学 会 专门 成 立 了 软件 标准 分 技术 委员 会 (SESS)。IEEE 通过 
的 标准 常常 要 报请 ANSI 审批 ， 使 具有 国家 标准 的 性 质 。 因 此 ，IEEE 公布 的 标准 常 冠 有 ANSI 
字 头 。 例 如 ，ANSIIEEE Str 828-1983 软件 配置 管理 计划 标准 。 

(2) 美国 国防 部 批准 、 颁 布 适用 于 美国 军队 内 部 使 用 的 标准 ， 代 号 为 DOD (采用 公制 计量 
单位 的 以 DOD 表示 ) 和 MIL。 

(3) 我 国 国防 科学 技术 工业 委员 会 批准 、 颁 布 适合 于 国防 部 门 和 军队 使 用 的 标准 ， 代 号 为 
GJB。 例 如 ，1988 年 发 布 实施 的 GJB473-88 军用 软件 开发 规范 。 


4. 国家 标准 化 组 织 

国家 标准 化 组 织 是 指 在 国家 范围 内 建立 的 标准 化 机 构 ， 以 及 政府 确认 或 承认 ) 的 标准 化 
团体 ， 或 者 接受 政府 标准 化 管理 机 构 指导 并 具有 权威 性 的 民间 标准 化 团体 。 这 些 组 织 主要 有 : 
美国 国家 标准 学 会 (American National Standards Institute，ANSI)、 英 国标 准 学 会 〈British 


Standards Institution，BSI)、 德 国标 准 化 学 会 (Deutsches Institution fur Normung，DIN) 以 及 法 
国标 准 化 协会 Association Francaise de Normalization，AFNOR )。 


13.1.4 1SO 9000 标准 简介 


1. ISO 9000 标准 


ISO 9000 标准 是 一 系列 标准 的 统称 。 ISO 9000 系列 标准 由 ISO/TC176 制定 。 TC176 是 ISO 
的 第 176 个 技术 委员 会 , 专门 负责 制定 质量 管理 和 质量 保证 技术 的 标准 , ISO 9000 系列 标准 的 
质量 管理 模式 为 企业 管理 注入 新 的 活力 和 生机 ， 给 质量 管理 体系 提供 评价 基础 ， 为 企业 进行 世 
界 贸易 带 来 质量 可 信 度 。 


2. ISO 9000: 2000 系列 标准 


ISO 9000: 2000 标准 族 由 以 下 4 个 核心 标准 构成 。 

(1) ISO 9000: 2000《 基 本 原理 和 术语 》 ISO 9001: 2000《 质 量 管理 体系 一 一 要 求 》 ISO 
9004: 2000《 质 量 管理 体系 一 一 业绩 改进 指南 》 和 ISO 19011: 2000《 质 量 和 环境 管理 审核 
指南 》。 

(2) 一 个 支持 标准 ISO 10012《 测 量 设备 的 质量 保证 要 求 》。 
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(3) 6 个 技术 报告 , 即 ISO 10006《 项 目 管理 指南 》 ISO 10007《 技 术 状 态 管理 指南 》 ISO 10013 
《质量 管理 体系 文件 指南 》 ISO 10014《 质 量 经 济 性 指南 》 ISO 10015 《教育 和 培训 指南 》 和 
ISO 10017《 统 计 技 术 在 ISO 900 中 的 应 用 指南 》。 

(4) 三 个 小 册子 ， 即 质量 管理 原理 、 选 择 和 使 用 指南 、 小 型 企业 的 应 用 指南 和 一 个 技术 规范 。 


3. 核心 标准 简介 


(1) ISO 9000: 2000《 质 量 管理 体系 一 一 基础 和 术语 》 

该 标准 描述 了 质量 管理 体系 的 基础 ， 并 规定 了 质量 管理 体系 的 术语 和 基本 原理 。 术 语 标准 
是 讨论 问题 的 前 提 ， 统 一 术语 是 为 了 明确 概念 ， 建 立 共 同 的 语言 。 它 在 总 结 了 质量 管理 经 验 的 
基础 上 , 明确 了 一 个 组 织 在 实施 质量 管理 中 必须 遵循 的 8 项 质量 管理 原则 , 也 是 ISO 9000:2000 
族 标 准 制定 的 指导 思想 和 理论 基础 。 

(2) ISO 9001: 2000《 质 量 管理 体系 一 一 要 求 》 

该 标准 是 用 于 第 三 方 认证 的 唯一 质量 管理 体系 要 求 标准 ， 通 常用 于 企业 建立 质量 管理 体系 
以 及 申请 认证 。 它 主要 通过 对 申请 认证 组 织 的 质量 管理 体系 提出 各 项 要 求 来 规范 组 织 的 质量 管 
理 体 系 。 主 要 分 为 5 大 模块 的 要 求 ， 即 质量 管理 体系 、 管 理 职责 、 资 源 管理 、 产 品 实现 、 测 量 
分 析 和 改进 ， 构 成 一 种 过 程 方法 模式 的 结构 ， 符 合 PDCA 循环 规则 ， 且 通过 持续 改进 的 环节 使 
质量 管理 体系 的 水 平 达到 螺旋 式 上 升 的 效应 ， 其 中 每 个 模块 中 又 有 许多 分 条 款 。 

(3) ISO 9004: 2000《 质 量 管理 体系 一 一 业绩 改进 指南 》 

该 标准 给 出 了 改进 质量 管理 体系 业绩 的 指南 ， 描 述 了 质量 管理 体系 应 包括 持续 改进 的 过 
程 , 强调 通过 改进 过 程 , 提高 组 织 的 业绩 , 使 组 织 的 顾客 和 其 他 相关 方 满意 。 该 标准 和 ISO 9001: 
2000 协调 一 致 并 可 一 起 使 用 质量 管理 体系 标准 ， 采 用 相同 的 原则 ， 但 应 注意 其 适用 范围 不 同 ， 
而 且 ISO 9004 标准 不 拟 作为 ISO 9001 标准 的 实施 指南 。 通 常情 况 下 ， 当 组 织 的 管理 者 希望 
超越 ISO 9001 标准 的 最 低 要 求 ， 追 求 增长 的 业绩 改进 时 ， 一 般 以 ISO 9004 标准 作为 指南 。 

(4) ISO 19011: 2001《 质 量 管理 体系 和 环境 管理 体系 审核 指南 》 

该 标准 提供 了 质量 管理 体系 和 环境 管理 体系 审核 的 基本 原则 、 审 核 方案 的 管理 、 环 境 和 质 
量 管理 体系 的 实施 以 及 对 环境 和 质量 管理 体系 评审 员 资格 要 求 提 供 了 指南 。 该 标准 是 
ISO/TC176 与 ISO/TC207 环 境 管理 技术 委员 会 ) 联合 制定 的 ， 按 照 “ 不 同 管理 体系 ， 可 以 共 
同 管理 和 审核 ”的 原则 , 在 术语 和 内 容 方面 , 兼容 了 质量 管理 体系 和 环境 管理 体系 两 方面 特点 。 


13.1.5 ”能 力 成 熟 度 模 型 简介 


软件 质量 是 人 们 实践 产物 的 属性 和 行为 ， 是 一 个 很 复杂 的 事物 性 质 和 行为 ， 可 以 通过 一 些 
方法 和 人 们 的 活动 来 改进 质量 。 概 括 地 说 ， 通 过 控制 软件 生产 过 程 、 提 高 软件 生产 者 组 织 性 和 
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软件 生产 者 个 人 能 力 来 改进 软件 质量 。 

软件 能 力 成 熟 度 模型 Capability Maturity Model，CMM) 是 一 个 目前 国际 上 较 流 行 、 较 实 
用 的 软件 生产 过 程 行业 标准 模型 ， 用 于 定义 和 评价 软件 开发 过 程 的 成 熟 度 ， 并 提供 怎样 做 才能 
提高 软件 质量 的 指导 ， 是 Camegie Mellon 大 学 软件 工程 研究 所 (CMU/SEI) 在 与 企业 界 和 政府 
合作 的 基础 上 开发 出 来 的 模型 。 

CMM 为 软件 企业 的 过 程 能 力 提 供 了 一 个 阶梯 式 的 进化 框架 ， 将 软件 过 程 改 进 的 进化 步骤 
组 织 成 5 个 成 熟 度 等 级 ， 每 一 个 级 别 定义 了 一 组 过 程 能 力 目标 ， 并 描述 了 要 达到 这 些 目标 应 该 
采取 的 实践 活动 ， 为 不 断 改 进 过 程 黄 定 了 循序 渐进 的 基础 。 第 一 级 实际 上 是 一 个 起 点 ， 任 何 准 
备 按 CMM 体系 进化 的 企业 都 自然 处 于 这 个 起 点 上 ， 并 通过 这 个 起 点 向 第 二 级 迈进 。 除 第 一 级 
外 ， 每 一 级 都 设 定 了 一 组 目标 ， 如 果 达 到 了 这 组 目标 ， 则 表明 达到 了 这 个 成 熟 级 别 ， 可 以 向 下 
一 个 级 别 迈 进 。CMM 体系 不 主张 跨越 级 别 的 进化 ， 因 为 从 第 二 级 起 ， 对 低级 别 的 实现 是 实现 
高 级 别 的 基础 。 

(1) 初始 级 。 在 初始 级 ， 企 业 一 般 缺 少 有 效 的 管理 ， 不 具备 稳定 的 软件 开发 与 维护 的 环境 。 

(2) 可 重复 级 。 在 可 重复 级 ， 企 业 建 立 了 基本 的 项 目 管理 过 程 的 政策 和 管理 规程 ， 对 成 本 、 
进度 和 功能 进行 监控 ， 以 加 强 过 程 能 力 。 对 新 项 目的 计划 和 管理 是 基于 以 往 的 相似 或 同类 项 目 
的 成 功 经 验 之 上 ， 以 确保 再 一 次 的 成 功 。 

(3) 定义 级 。 在 定义 级 ， 企 业 全 面 采 用 综合 性 的 管理 及 工程 过 程 来 管理 ， 对 整个 软件 生命 
周期 的 管理 与 工程 化 过 程 都 已 标准 化 ， 并 综合 成 软件 开发 企业 标准 的 软件 过 程 。 企 业 标准 软件 
过 程 是 通过 证 明 的 ， 是 正确 且 实用 的 ， 所 有 开发 的 项 目 需 根 据 标准 过 程 ， 前 裁 出 与 项 目 适宜 的 
过 程 ， 并 执行 这 些 过 程 。 企 业 标 准 软件 过 程 被 应 用 到 所 有 的 工程 中 ， 用 于 编制 和 维护 软件 。 

(4) 管理 级 。 在 管理 级 ， 企 业 开始 定量 地 认识 软件 过 程 ， 软 件 质量 管理 和 软件 过 程 管理 
是 量化 的 管理 。 对 软件 过 程 与 产品 质量 建立 了 定量 的 质量 目标 ， 制 定 了 软件 过 程 和 产品 质量 的 
详细 而 具体 的 度量 标准 ， 实 现 了 度量 标准 化 。 通 过 一 致 的 度量 标准 来 指导 软件 过 程 ， 保 证 所 有 
项 目 对 生产 率 和 质量 进行 度量 ， 并 作为 评价 软件 过 程 及 产品 的 定量 基础 。 量 化 控制 使 得 软件 
发 真正 成 为 一 种 工业 生产 活动 。 软 件 过 程 按照 明确 的 度量 标准 度量 和 操作 ， 软 件 过 程 以 及 软件 
产品 质量 的 一 些 趋势 就 得 以 控制 和 预见 。 

(5) 优化 级 。 在 优化 级 ， 企 业 将 会 把 工作 重点 放 在 对 软件 过 程 改进 的 持续 性 、 预 见 及 增 
强 自身 ， 防 止 缺 陷 及 问题 的 发 生 ， 不 断 地 提高 过 程 处 理 能 力 上 。 通 过 来 自 过 程 执行 的 质量 反馈 
和 吸收 新 方法 和 新 技术 的 定量 分 析 来 改善 下 一 步 的 执行 过 程 ， 即 优化 执行 步 又， 使 软件 过 程 能 
不 断 地 得 到 改进 。 根 据 软件 过 程 的 效果 ， 进 行 成 本 /利润 分 析 ， 从 成 功 的 软件 过 程 中 吸取 经 验 ， 
把 最 好 的 创新 成 绩 迅 速 向 全 企业 转移 ， 对 失败 的 案例 进行 分 析 以 找 出 原因 并 预先 改进 ， 把 失败 
的 教训 告知 全 体 组 织 以 防止 重复 以 前 的 错误 ， 不 断 提高 产品 的 质量 和 生产 率 。 
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13.2 ”知识 产权 基础 知识 


13.2.1 知识 产权 基本 概念 


1. 知识 产权 


知识 产权 也 称 为 智慧 财产 权 ) 是 指 人 们 基于 自己 的 智力 活动 创造 的 成 果 和 经 营 管理 活动 
中 的 经 验 、 知 识 而 依法 享有 的 权利 。 我 国 《民法 通则 》 规 定 ， 知 识 产 权 是 指 民事 权利 主体 〈 公 
民 、 法 人 ) 基于 创造 性 的 智力 成 果 。 知 识 产 权 保护 制度 是 现代 社会 发 展 不 可 缺少 的 一 种 法 律 制 
度 。 我 国 《民法 通则 》 知 识 产权 是 指 民 事权 利 的 主体 公民、 法 人 ) 基于 创造 性 的 智力 成 果 。 

世界 知识 产权 组 织 公约 罗列 的 知识 产权 范围 包括 下 列 各 项 权利 。 

(1) 与 文学 、 艺 术 和 科学 作品 有 关 的 权利 (著作 权 )。 

(2) 与 表演 艺术 家 的 表演 以 及 录音 和 广播 有 关 的 权利 〈 邻 接 权 )。 

(3) 与 人 类 创造 性 活动 的 一 切 领域 内 的 发 明 有 关 的 权利 〈 专 利 权 )。 

(4) 与 科学 发 现 有 关 的 权利 〈 科 学 发 现 权 )。 

(5) 与 工业 品 外 观 设计 有 关 的 权利 〈 专 利 权 )。 

(6) 与 商标 、 服 务 标记 、 商 号 《企业 名 称 ) 以 及 其 他 商业 标记 有 关 的 权利 〈 商 标 权 )。 

(7) 与 制止 不 正当 竞争 有 关 的 权利 ( 反 不 正当 竞争 权 )。 

(8) 在 工业 、 科 学 、 文 学 艺术 领域 内 由 于 智力 创造 活动 而 所 产生 的 一 切 其 他 权利 。 

知识 产权 可 分 为 工业 产权 和 著作 权 两 类 。 

(1) 工业 产权 。 根 据 保 护 工业 产权 巴黎 公约 第 一 条 的 规定 ， 工 业 产权 包括 专利 、 实 用 新 型 、 
工业 品 外 观 设计 、 商 标 、 服 务 标 记 、 厂 商 名 称 、 产 地 标记 或 原 产地 名 称 、 制 止 不 正当 竞争 等 项 
内 容 。 此 外 ， 商 业 秘密 、 微 生物 技术 和 遗传 基因 技术 等 也 属于 工业 产权 保护 的 对 象 。 近 年 来 ， 
在 一 些 国家 可 以 通过 申请 专利 对 计算 机 软件 进行 专利 保护 。 

(2) 著作 权 。 著 作 权 〈 也 称 为 版 权 ) 是 指 作者 对 其 创作 的 作品 享有 的 人 身 权 和 财产 权 。 人 
身 权 包括 发 表 权 、 署 名 权 、 修 改 权 和 保护 作品 完整 权 等 ， 财产权 包 括 作品 的 使 用 权 和 获得 报酬 
权 ， 即 以 复制 、 表 演 、 播 放 、 展 览 、 发 行 、 摄 制 电影 、 电 视 、 录 像 或 者 改编 、 翻 译 、 注 释 、 编 
辑 等 方式 使 用 作品 的 权利 ， 以 及 许可 他 人 以 上 述 方式 使 用 作品 并 由 此 获得 报酬 的 权利 。 


2. 知识 产权 的 特点 
知识 产权 的 特点 主要 包括 : 无 形 性 、 独 占 性 、 地 域 性 和 时 效 性 。 
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(1) 无 形 性 。 知 识 产权 是 一 种 无 形 财产 权 。 知 识 产权 的 客体 指 的 是 智力 创作 性 成 果 〈 也 称 
为 知识 产品 ) ， 是 一 种 没有 形体 的 精神 财富 。 它 是 可 以 脱离 其 所 有 者 而 存在 的 无 形 信息 ， 可 以 
同时 为 多 个 主体 所 使 用 , 在 一 定 条 件 下 不 会 因 多 个 主体 的 使 用 而 使 该 项 知识 财产 自身 遭受 损耗 
或 者 灭失 。 

(2) 双重 性 。 某 些 知识 产权 具有 财产 权 和 人 身 权 双重 性 ， 例 如 著作 权 ， 其 财产 权 属 性 主要 
体现 在 所 有 人 享有 的 独占 权 以 及 许可 他 人 使 用 而 获得 报酬 的 权利 ,所 有 人 可 以 通过 独自 实施 获 
得 收益 ， 也 可 以 通过 有 偿 许 可 他 人 实施 获得 收益 ， 还 可 以 像 有 形 财产 那样 进行 买卖 或 抵押 ;其 
人 身 权 属性 主要 是 指 署 名 权 等 。 有 的 知识 产权 具有 单一 的 属性 ， 例 如 ， 发 现 权 只 具有 名 誉 权 属 
性 ， 而 没有 财产 权 属 性 ， 商 业 秘密 只 具有 财产 权 属性 ， 而 没有 人 身 权 属性 ;专利 权 、 商 标 权 主 
要 体现 为 财产 权 。 

(3) 确认 性 。 无 形 的 智力 创作 性 成 果 不 像 有 形 财产 那样 直观 可 见 ， 因 此 ， 智 力 创作 性 成 果 
的 财产 权 需 要 依法 审查 确认 ， 以 得 到 法 律 保 护 。 在 我 国 ， 发 明 人 所 完成 的 发 明 ， 其 实用 新 型 或 
者 外 观 设 计 已 经 具有 价值 和 使 用 价值 ， 但 是 ， 其 完成 人 尚 不 能 自动 获得 专利 权 ， 完 成 人 必须 依 
照 专利 法 的 有 关 规 定向 国家 专利 局 提出 专利 申请 ， 专 利 局 依照 法 定 程序 进行 审查 ， 申 请 符合 专 
利 法 规定 条 件 的 ， 由 专利 局 做 出 授予 专利 权 的 决定 ， 颁 发 专利 证 书 ， 只 有 当 专 利 局 发 布 授权 公 
告 后 ， 其 完成 人 才 享 有 该 项 知识 产权 。 

(4) 独占 性 。 由 于 智力 成 果 具 有 可 以 同时 被 多 个 主体 所 使 用 的 特点 ， 因 此 ， 法 律 授 予 知识 
产权 一 种 专 有 权 , 具有 独占 性 。 未 经 权利 人 许可 ,任何 单位 或 个 人 不 得 使 用 , 否则 就 构成 侵权 ， 
应 承担 相应 的 法 律 责任 。 
(5) 地 域 性 。 知 识 产 权 具 有 严格 的 地 域 性 特点 ， 即 各 国 主管 机 关 依照 本 国法 律 授予 的 知识 
产权 ， 只 能 在 其 本 国 领 域内 受 法 律 保护 ， 例 如 中 国 专利 局 授予 的 专利 权 或 中 国 商 标 局 核准 的 商 
标 专用 权 ， 只 能 在 中 国 领域 内 受 保护 ， 其 他 国家 则 不 给 予 保护 。 外 国人 在 我 国 领域 外 使 用 中 国 
专利 局 授权 的 发 明 专利 ， 不 侵犯 我 国 专利 权 。 所 以 ， 我 国 公民 、 法 人 完成 的 发 明 创造 要 想 在 外 
国 受 保护 ， 必 须 在 外 国 申请 专利 。 著 作 权 虽然 自动 产生 ， 但 它 受 地 域 限制 ， 我 国法 律 对 外 国人 
的 作品 并 不 都 给 予 保护 ， 只 保护 共同 参加 国际 条 约 国 家 的 公民 人 作品。 同样， 公约 的 其 他 成 员 
也 按照 公约 规定 ， 对 我 国 公民 和 法 人 的 作品 给 予 保护 。 还 有 按照 两 国 的 双边 协定 ， 相 互 给 予 对 
方 国民 的 作品 保护 。 
(6) 时 效 性 。 知 识 产权 具有 法 定 的 保护 期 限 ， 一 旦 保护 期 限 届满 ， 权 利 将 自行 终止 ， 成 为 
社会 公众 可 以 自由 使 用 的 知识 。 保 护 期 限 的 长 短 依 各 国 的 法 律 确定 。 例 如 ， 我 国 发 明 专 利 的 保 
护 期 为 20 年 ， 实 用 新 型 专利 权 和 外 观 设计 专利 权 的 期 限 为 10 年 ， 均 自 专利 申请 日 起 计算 。 我 
国 公民 的 作品 发 表 权 的 保护 期 为 作者 终生 及 其 死亡 后 50 年 。 我 国 商标 权 的 保护 期 限 自 核准 注 
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册 之 日 起 10 年 内 有 效 ， 但 可 以 根据 其 所 有 人 的 需要 无 限 地 续 展 权利 期 限 ， 在 期 限 届满 前 6 个 
月 内 申请 续 展 注册 ， 每 次 续 展 注册 的 有 效 期 为 10 年 ， 续 展 注册 的 次 数 不 限 。 如 果 商 标 权 人 逾 
期 不 办 理 续 展 注册 ， 其 商标 权 也 将 终止 。 商 业 秘 密 受 法 律 保护 的 期 限 是 不 确定 的 ， 该 秘密 一 旦 
被 公众 所 知悉 ， 即 成 为 公众 可 以 自由 使 用 的 知识 。 


3. 我 国保 护 知识 产权 的 法 规 


目前 ， 我 国 已 有 比较 完备 的 知识 产权 保护 法 律 体系 ， 保 护 知识 产权 的 法 律 主要 有 中 华人 民 
共和 国 著作 权 法 、 中 华人 民 共和 国 专利 法 、 中 华人 民 共和 国 继承 法 、 中 华人 民 共和 国 合 同 法 、 
中 华人 民 共 和 国 商标 法 、 中 华人 民 共 和 国 反 不 正当 竞争 法 和 中 华人 民 共 和 国 计 算 机 软件 保护 条 
例 等 。 


13.2.2 ”计算 机 软件 著作 权 


1， 计 算 机 软件 著作 权 的 主体 与 客体 


1) 计算 机 软件 著作 权 的 主体 

计算 机 软件 著作 权 的 主体 指 享有 著作 权 的 人 。 根 据 著作 权 法 和 《计算 机 软件 保护 条 例 》 的 
规定 ， 计 算 机 软件 著作 权 的 主体 包括 公民 、 法 人 和 其 他 组 织 。 著 作 权 法 和 《计算 机 软件 保护 条 
例 》 未 规定 对 主体 的 行为 能 力 限制 ， 同 时 对 外 国人 、 无 国籍 人 的 主体 资格 ， 奉 行 “ 有 条 件 ” 的 
国民 待遇 原则 。 

(1) 公民 。 公 民 《〈 即 指 自 然 人 ) 通过 以 下 途径 取得 软件 著作 权 主 体 资格 。 

@ 公民 自行 独立 开发 软件 (软件 开发 者 )。 

@ 订立 委托 合同 ， 委 托 他 人 开发 软件 ， 并 约定 软件 著作 权 归 自己 享有 。 

@ 通过 转让 途径 取得 软件 著作 财产 权 主 体 资格 〈 软 件 权 利 的 受 让 者 ) 。 

图 公民 之 间或 与 其 他 主体 之 间 ， 对 计算 机 软件 进行 合作 开发 而 产生 的 公民 群体 或 者 公民 
与 其 他 主体 成 为 计算 机 软件 作品 的 著作 权 人 。 

@ 根据 《继承 法 》 的 规定 通过 继承 取得 软件 著作 财产 权 主体 资格 。 

(2) 法 人 。 法 人 是 具有 民事 权利 能 力 和 民事 行为 能 力 ， 依 法 独立 享有 民事 权利 和 承担 义务 
的 组 织 。 计 算 机 软件 的 开发 往往 需要 较 大 投资 和 较 多 的 人 员 ， 法 人 则 具有 资金 来 源 丰 富 和 科技 
人 才 众 多 的 优势 ， 因 而 法 人 是 计算 机 软件 著作 权 的 重要 主体 。 法 人 一 般 通 过 以 下 途径 取得 计算 
机 软件 著作 权 主体 资格 。 

@ 由 法 人 组 织 并 提供 创作 物质 条 件 所 实施 的 开发 ， 并 由 法 人 承担 社会 责任 。 

@ 通过 接受 委托 、 转 让 等 各 种 有 效 合 同 关系 而 取得 著作 权 主体 资格 。 
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@ 因 计 算 机 软件 著作 权 主 体 (法人) 发 生变 更 而 依法 成 为 著作 权 主 体 。 

(3) 其 他 组 织 。 其 他 组 织 是 指 除去 法 人 以 外 的 能 够 取得 计算 机 软件 著作 权 的 其 他 民事 主体 ， 
包括 非法 人 单位 和 合作 伙伴 等 。 

2) 计算 机 软件 著作 权 的 客体 

计算 机 软件 著作 权 的 客体 是 指 著 作 权 法 保护 的 计算 机 软件 著作 权 的 范围 ( 受 保护 的 对 象 ) 。 
根据 著作 权 法 第 三 条 和 《计算 机 软件 保护 条 例 》 第 二 条 的 规定 ， 著 作 权 法 保护 的 计算 机 软件 是 
指 计算 机 程序 及 其 相关 文档 。 著 作 权 法 规定 对 计算 机 软件 的 保护 是 指 计算 机 软件 的 著作 权 人 或 
者 其 受 让 者 依法 享有 著作 权 的 各 项 权利 。 

(1) 计算 机 程序 。 根 据 《 根 据 计算 机 软件 保护 条 例 》 第 三 条 第 一 款 的 规定 ， 计 算 机 程序 是 
指 为 了 得 到 某 种 结果 而 可 以 由 计算 机 等 具有 信息 处 理 能 力 的 装置 执行 的 代码 化 指令 序列 , 或 者 
可 被 自动 转换 成 代码 化 指令 序列 的 符号 化 语句 序列 。 计 算 机 程序 包括 源 程序 和 目标 程序 ， 同 一 
程序 的 源 程序 文本 和 目标 程序 文本 视 为 同一 软件 作品 。 

(2) 计算 机 软件 的 文档 。 根 据 《 计 算 机 软件 保护 条 例 》 第 三 条 第 二 款 的 规定 ， 计 算 机 程序 
的 文档 是 指 用 自然 语言 或 者 形式 化 语言 所 编写 的 文字 资料 和 图 表 , 用 来 描述 程序 的 内 容 、 组成、 
设计 、 功 能 规格 、 开 发 情况 、 测 试 结果 及 使 用 方法 等 。 文 档 一 般 以 程序 设计 说 明 书 、 流 程 图 和 
用 户 手册 等 表现 。 


2. 计算 机 软件 受 著作 权 法 保护 的 条 件 


《计算 机 软件 保护 条 例 》 规 定 ， 依 法 受到 保护 的 计算 机 软件 作品 必须 符合 下 列 条 件 。 

(1) 独立 创作 。 受 保护 的 软件 必须 由 开发 者 独立 开发 创作 ， 任 何 复制 或 抄袭 他 人 开发 的 软 
件 不 能 获得 著作 权 。 程 序 的 功能 设计 往往 被 认为 是 程序 的 思想 概念 ， 根 据 著 作 权 法 不 保护 思想 
概念 的 原则 ， 任 何人 可 以 设计 具有 类 似 功能 的 另 一 件 软件 作品 。 但 是 ， 如 果 用 了 他 人 软件 作品 
的 逻辑 步骤 的 组 合 方式 ， 则 对 他 人 软件 构成 侵权 。 

(2) 可 被 感知 。 受 著作 权 法 保护 的 作品 应 当 是 作者 创作 思想 在 固定 载体 上 的 一 种 实际 表达 。 
如 果 作者 的 创作 思想 未 表达 出 来 ， 不 可 以 被 感知 ， 就 不 能 得 到 著作 权 法 的 保护 。 因 此 , 《计算 
机 软件 保护 条 例 》 规 定 ， 受 保护 的 软件 必须 固定 在 某 种 有 形 物 体 上 ， 例 如 固定 在 存储 器 、 磁 盘 
和 磁带 等 设备 上 ， 也 可 以 是 其 他 的 有 形 物 ， 如 纸张 等 。 
(3) 逻辑 合理 。 轴 辑 判断 功能 是 计算 机 系统 的 基本 功能 。 因 此 ， 受 著作 权 法 保护 的 计算 机 
软件 作品 必须 具备 合理 的 逻辑 思想 , 并 以 正确 的 逻辑 步骤 表现 出 来 , 才能 达到 软件 的 设计 功能 。 
毫 无 逻辑 性 的 计算 机 软件 ， 不 能 计算 出 正确 结果 ， 也 就 毫 无 价值 。 
根据 《计算 机 软件 保护 条 例 》 第 六 条 的 规定 ， 除 计算 机 软件 的 程序 和 文档 外 ， 著 作 权 法 不 
保护 计算 机 软件 开发 所 用 的 思想 、 概 念 、 发 现 、 原 理 、 算 法 、 处 理 过 程 和 运算 方法 。 也 就 是 说 ， 
利用 已 有 的 上 述 内 容 开发 软件 ， 并 不 构成 侵权 。 因 为 开发 软件 时 所 采用 的 思想 、 概 念 等 均 属 计 
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算 机 软件 基本 理论 的 范围 ， 是 设计 开发 软件 不 可 或 缺 的 理论 依据 ， 属 于 社会 公有 和 领域， 不 能 被 
个 人 专 有 。 


3. 计算 机 软件 著作 权 的 权利 


1) 计算 机 软件 的 著作 人 身 权 

《中 华人 民 共 和 国 著作 权 法 》 规 定 ， 软 件 作 品 享有 两 类 权利 ， 一 类 是 软件 著作 权 的 人 身 权 
(精神 权利 ); 另 一 类 是 软件 著作 权 的 财产 权 〔 经 济 权利 ) 。《 计 算 机 软件 保护 条 例 》 规 定 ， 
软件 著作 权 人 享有 发 表 权 和 开发 者 身份 权 ， 这 两 项 权利 与 软件 著作 权 人 的 人 身 权 是 不 可 分 
离 的 。 

(1) 发 表 权 。 发 表 权 是 指 决定 软件 作品 是 否 公之于众 的 权利 ， 即 指 软件 作品 完成 后 ， 以 复 
制 、 展 示 、 发 行 或 者 翻译 等 方式 使 软件 作品 在 一 定数 量 不 特定 人 的 范围 内 公开 。 发 表 权 的 具体 
内 容 包 括 软件 作品 发 表 的 时 间 、 发 表 的 形式 以 及 发 表 的 地 点 等 。 

(2) 开发 者 身份 权 〔 也 称 为 署名 权 )。 开 发 者 身份 权 是 指 作者 为 表明 身份 在 软件 作品 中 渚 
自己 名 字 的 权利 。 开 发 者 的 身份 权 不 随 软件 开发 者 的 消亡 而 丧失 ， 且 无 时 间 限 制 。 

2) 计算 机 软件 的 著作 财产 权 

财产 权 通 常 是 指 由 软件 著作 权 人 控制 和 支配 ， 并 能 够 为 权利 人 带 来 一 定 经 济 效益 的 权利 。 
《计算 机 软件 保护 条 例 》 规 定 ， 软 件 著作 权 人 享有 下 述 软件 财产 权 。 

(1) 使 用 权 。 即 在 不 损害 社会 公共 利益 的 前 提 下 ， 以 复制 、 修 改 、 发 行 、 翻 译 、 注 释 等 方 
式 合作 软件 的 权利 。 

(2) 复制 权 。 即 将 软件 作品 制作 一 份 或 多 份 的 行为 。 复 制 权 就 是 版 权 所 有 人 决定 实施 或 不 
实施 上 述 复制 行为 或 者 禁止 他 人 复制 其 受 保护 作品 的 权利 。 

(3) 修改 权 。 即 对 软件 进行 增补 、 删 节 ， 或 者 改变 指令 、 语 句 顺序 等 以 提高 、 完 善 原 软件 
作品 的 作法 。 修 改 权 即 指 作者 享有 的 修改 或 者 授权 他 人 修改 软件 作品 的 权利 。 

(4) 发 行 权 。 发 行 是 指 为 满足 公众 的 合理 需求 ， 通 过 出 售 、 出 租 等 方式 向 公众 提供 一 定数 
量 的 作品 复制 件 。 发 行 权 即 以 出 售 或 赠与 方式 向 公众 提供 软件 的 原件 或 者 复制 件 的 权利 。 

(5) 翻译 权 。 翻 译 是 指 以 不 同 于 原 软件 作品 的 一 种 程序 语言 转换 该 作品 原 使 用 的 程序 语 
而 重 现 软件 作品 内 容 的 创作 。 简 单 地 说 ， 翻 译 权 是 指 将 原 软件 从 一 种 程序 语言 转换 成 另 一 
种 程序 语言 的 权利 。 

(6) 注释 权 。 软 件 作品 的 注释 是 指 对 软件 作品 中 的 程序 语句 进行 解释 ， 以 便 更 好 地 理解 软 
件 作品 。 注 释 权 是 指 著 作 权 人 对 自己 的 作品 享有 进行 注释 的 权利 。 

(7) 信息 网 络 传播 权 。 以 有 线 或 者 无 线 信息 网 络 方式 向 公众 提供 软件 作品 ， 使 公众 可 在 其 
个 人 选 定 的 时 间 和 地 点 获得 软件 作品 的 权利 。 

(8) 出 租 权 。 即 有 偿 许 可 他 人 临时 使 用 计算 机 软件 的 复制 件 的 权利 ， 但 是 ， 计 算 机 软件 不 


Il 
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是 出 租 的 主要 标的 除外 。 

(9) 使 用 许可 权 和 获得 报酬 权 。 即 许可 他 人 以 上 述 方式 使 用 软件 作品 的 权利 〈 许 可 他 人 行 
使 软件 著作 权 中 的 财产 权 ) 和 依照 约定 或 者 有 关 法 律 规定 获得 报酬 的 权利 。 

(10) 转让 权 。 即 向 他 人 转让 软件 的 使 用 权 和 使 用 许可 权 的 权利 。 软 件 著作 权 人 可 以 全 部 
或 者 部 分 转让 软件 著作 权 中 的 财产 权 。 

3) 软件 合法 持 有 人 的 权利 

根据 《计算 机 软件 保护 条 例 》 的 规定 ， 软 件 的 合法 复制 品 所 有 人 享有 下 述 权 利 。 

(1) 根据 使 用 的 需要 把 软件 装 入 计算 机 等 能 存储 信息 的 装置 内 。 

(2) 根据 需要 进行 必要 的 复制 。 

(3) 为 了 防止 复制 品 损坏 而 制作 备份 复制 品 。 这 些 复制 品 不 得 通过 任何 方式 提供 给 他 人 使 
用 ， 并 在 所 有 人 丧失 该 合法 复制 品 所 有 权时 ， 负 责 将 备份 复制 品 销毁 。 

(4) 为 了 把 该 软件 用 于 实际 的 计算 机 应 用 环境 或 者 改进 其 功能 性 能 而 进行 必要 的 修改 。 但 
是 ， 除 合同 约定 外 ， 未 经 该 软件 著作 权 人 许可 ， 不 得 向 任何 第 三 方 提供 修改 后 的 软件 。 


4. 计算 机 软件 著作 权 的 行使 


(1) 软件 经 济 权 利 的 许可 使 用 。 软 件 经 济 权利 的 许可 使 用 是 指 软件 著作 权 人 或 权利 合法 受 
让 者 ， 通 过 合同 方式 许可 他 人 使 用 其 软件 ， 并 获得 报酬 的 一 种 软件 贸易 形式 。 许 可 使 用 的 方式 
可 分 为 独占 许可 使 用 、 独 家 许可 使 用 、 普 通 许可 使 用 、 法 定 许可 使 用 和 强制 许可 使 用 。 

(2) 软件 经 济 权 利 的 转让 使 用 。 软 件 经 济 权利 的 转让 使 用 是 指 软件 著作 权 人 将 其 享有 的 软 
件 著作 权 中 的 经 济 权利 全 部 转移 给 他 人 。 软 件 经 济 权利 的 转让 将 改变 软件 权利 的 归属 ， 原 始 著 
作 权 人 的 主体 地 位 随 着 转让 活动 的 发 生 而 丧失 ， 软 件 著作 权 受 让 者 成 为 新 的 著作 权 主 体 。《 计 
算 机 软件 保护 条 例 》 规 定 ， 软 件 著作 权 转 让 必须 签订 书面 合同 。 同 时 ， 软 件 转让 活动 不 能 改变 
软件 的 保护 期 。 转 让 方式 包括 出 买 、 赠 与 、 抵 押 和 赔偿 等 ， 可 以 定期 转让 或 者 永久 转让 。 


5. 计算 机 软件 著作 权 的 保护 期 


根据 《著作 权 法 》 和 《计算 机 软件 保护 条 例 》 的 规定 ， 计 算 机 软件 著作 权 的 权利 自 软件 
发 完成 之 日 起 产生 ， 保 护 期 为 50 年 。 保 护 期 满 ， 除 开发 者 身份 权 以 外 ， 其 他 权利 终止 。 一 旦 
计算 机 软件 著作 权 超 出 保护 期 ， 软 件 就 进入 公有 领域。 计算 机 软件 著作 权 人 的 单位 终止 和 计算 
机 软件 著作 权 人 的 公民 死亡 均 无 合法 继承 人 时 ， 除 开发 者 身份 权 以 外 ， 该 软件 的 其 他 权利 进入 
公有 领域。 软件 进入 公有 和 领域 后 成 为 社会 公共 财富 ， 公 众 可 无 偿 使 用 。 


. 计算 机 软件 著作 权 的 归属 
我 国 著作 权 法 对 著作 权 的 归属 采取 了 “创作 主义 ”原则 ， 明 确 规定 著作 权 属于 作者 ， 除 非 


a 
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另 有 规定 。《 计 算 机 软件 保护 条 例 》 第 九条 规定 “软件 著作 权 属 于 软件 开发 者 ， 本 条 例 另 有 规 
定 的 情况 除外 。” 这 是 我 国 计 算 机 软件 著作 权 归 属 的 基本 原则 。 

计算 机 软件 开发 者 是 计算 机 软件 著作 权 的 原始 主体 ， 也 是 享有 权利 最 完整 的 主体 。 软 件 作 
品 是 开发 者 从 事 智力 创作 活动 所 取得 的 智力 成 果 ， 是 脑力 劳动 的 结晶 。 其 开发 创作 行为 使 开发 
者 直接 取得 该 计算 机 软件 的 著作 权 。 因 此 , 《计算 机 软件 保护 条 例 》 第 九条 明确 规定 “软件 著 
作 权 属于 软件 开发 者 ”， 即 以 软件 开发 的 事实 来 确定 著作 权 的 归属 ， 谁 完成 了 计算 机 软件 的 创 
作 开 发 工作 ， 其 软件 的 著作 权 就 归 谁 享有 。 

1) 职务 开发 软件 著作 权 的 归属 

职务 软件 作品 是 指 公民 在 单位 任职 期 间 为 执行 本 单位 工作 任务 所 开发 的 计算 机 软件 作品 。 
《计算 机 软件 保护 条 例 》 第 十 三 条 作 了 明确 的 规定 ， 即 公民 在 单位 任职 期 间 所 开发 的 软件 ， 如 
果 是 执行 本 职工 作 的 结果 ， 即 针对 本 职工 作 中 明确 指定 的 开发 目标 所 开发 的 ;或 者 是 从 事 本 职 
工作 活动 所 预见 的 结果 或 者 自然 的 结果 ， 则 该 软件 的 著作 权 属 于 该 单位 ; 或 者 主要 使 用 了 单位 
的 专用 设备 、 未 公开 的 专门 信息 等 物资 技术 条 件 所 开发 并 由 法 人 或 者 其 他 组 织 承担 责任 的 软 
件 。 根 据 《 计 算 机 软件 保护 条 例 》 规 定 ， 可 以 得 出 这 样 的 结论 : 当 公民 作为 某 单位 的 雇员 时 ， 
如 其 开发 的 软件 属于 执行 本 职工 作 的 结果 ， 该 软件 著作 权 应 当归 单位 享有 。 若 开发 的 软件 不 是 
执行 本 职工 作 的 结果 , 其 著作 权 就 不 属 单位 享有 。 如 果 该 雇员 主要 使 用 了 单位 的 设备 , 按照 《 计 
算 机 软件 保护 条 例 》 第 十 三 条 第 三 款 的 规定 ， 不 能 属于 该 雇员 个 人 享有 。 

对 于 公民 在 非 职务 期 间 创作 的 计算 机 程序 ， 其 著作 权 属于 某 项 软件 作品 的 开发 单位 ,还 是 
从 事 直接 创作 开发 软件 作品 的 个 人 ， 可 按照 《计算 机 软件 保护 条 例 》 第 十 三 条 规定 的 三 条 标准 
确定 。 

(1) 所 开发 的 软件 作品 不 是 执行 其 本 职工 作 的 结果 。 

任何 受 雇 于 一 个 单位 的 人 员 ， 都 会 被 安排 在 一 定 的 工作 岗位 和 分 派 相 应 的 工作 任务 。 完 成 
分 派 的 工作 任务 就 是 他 的 本 职工 作 , 本 职工 作 的 直接 成 果 也 就 是 其 工作 任务 的 不 断 完成 。 当然， 
具体 工作 成 果 又 会 产生 许多 效益 、 产 生 范 围 更 广 的 结果 。 但 是 ， 该 条 标准 指 的 是 雇员 本 职工 作 
最 直接 的 成 果 。 若 雇员 开发 创作 的 软件 不 是 执行 本 职工 作 的 结果 ， 则 构成 非 职务 计算 机 软件 著 
作 权 的 条 件 之 一 。 

(2) 开发 的 软件 作品 与 开发 者 在 单位 中 从 事 的 工作 内 容 无 直接 联系 。 
如 果 该 雇员 在 单位 担任 软件 开发 工作 , 引起 争议 的 软件 作品 不 能 与 其 本 职工 作 中 明确 指定 
的 开发 目标 有 关 ， 软 件 作品 的 内 容 也 不 能 与 其 本 职工 作 所 开发 的 软件 的 功能 、 逻 辑 思维 和 重要 
数据 有 关 。 雇 员 所 开发 的 软件 作品 与 其 本 职工 作 没有 直接 的 关系 ， 则 构成 非 职务 计算 机 软件 著 
作 权 的 第 二 个 条 件 。 
(3) 开发 的 软件 作品 未 使 用 单位 的 物质 技术 条 件 。 
开发 创作 软件 作品 所 使 用 的 物质 技术 条 件 ， 即 开发 软件 作品 所 必需 的 设备 、 数 据 、 资 金 和 
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其 他 软件 开发 环境 ， 不 属于 雇员 所 在 的 单位 所 有 。 没 有 使 用 受 雇 单位 的 任何 物质 技术 条 件 构成 
非 职务 软件 著作 权 的 第 三 个 条 件 。 

雇员 进行 本 职工 作 以 外 的 软件 开发 创作 ， 必 须 同 时 符合 上 述 三 个 条 件 ， 才 能 算是 非 职务 软 
件 作 品 ， 雇 员 个 人 才 享 有 软件 著作 权 。 常 有 软件 开发 符合 前 两 个 条 件 ， 但 使 用 了 单位 的 技术 情 
报 资料 、 计 算 机 设备 等 物质 技术 条 件 的 情况 。 处 理 此 种 情况 较 好 的 方法 是 对 该 软件 著作 权 的 归 
属 应 当 由 单位 和 雇员 双方 协商 确定 ， 如 对 于 公民 在 非 职务 期 间 利用 单位 物质 条 件 创作 的 与 单位 
业务 范围 无 关 的 计算 机 程序 ， 其 著作 权 属 于 创作 程序 的 作者 ， 但 作者 许可 第 三 人 使 用 软件 时 
应 当 支 付 单位 合理 的 物质 条 件 使 用 费 ， 如 计算 机 机 时 费 等 。 若 通过 协商 不 能 解决 ， 按 上 述 三 条 
标准 做 出 界定 。 

2) 合作 开发 软件 著作 权 的 归属 

合作 开发 软件 是 指 两 个 或 两 个 以 上 公民 、 法 人 或 其 他 组 织 订立 协议 ， 共 同 参加 某 项 计算 机 
软件 的 开发 并 分 享 软件 著作 权 的 形式 。《 计 算 机 软件 保护 条 例 》 第 十 条 规定 : “由 两 个 以 上 的 
自然 人 、 法 人 或 者 其 他 组 织 合作 开发 的 软件 , 其 著作 权 的 归属 由 合作 开发 者 签订 书面 合同 约定 。 
无 书面 合同 或 者 合同 未 作 明确 约定 ,合作 开发 的 软件 可 以 分 割 使 用 的 ， 开 发 者 对 各 自 开发 的 部 
分 可 以 单独 享有 著作 权 ; 但 是 ， 行 使 著作 权时 ， 不 得 扩展 到 合作 开发 的 软件 整体 的 著作 权 。 合 
作 开 发 的 软件 不 能 分 割 使 用 的 ， 其 著作 权 由 合作 开发 者 共同 享有 ， 通 过 协商 一 致 行使， 如 不 能 
协商 一 致 ， 又 无 正当 理由 ， 任 何 一 方 不 得 阻止 他 方 行使 除 转让 权 以 外 的 其 他 权利 ， 但 是 所 得 收 
益 应 合理 分 配给 所 有 合作 开发 者 。” 根 据 此 规定 ， 对 合作 开发 软件 著作 权 的 归属 应 掌握 以 下 
4 点 。 

(1) 由 两 个 以 上 的 单位 、 公 民 共 同 开发 完成 的 软件 属于 合作 开发 的 软件 。 对 于 合作 开发 的 
软件 ， 其 著作 权 的 归属 一 般 是 由 各 合作 开发 者 共同 享有 。 但 如 果 有 软件 著作 权 的 协议 ， 则 按照 
协议 确定 软件 著作 权 的 归属 。 

(2) 由 于 合作 开发 软件 著作 权 是 由 两 个 以 上 单位 或 者 个 人 共同 享有 ， 因 而 为 了 避免 在 软件 
著作 权 的 行使 中 产生 纠纷 ， 规 定 “ 合 作 开发 的 软件 ， 其 著作 权 的 归属 由 合作 开发 者 签订 书面 合 
同 约定 。”。 
(3) 对 于 合作 开发 的 软件 著作 权 按 以 下 规定 执行 : “无 书面 合同 或 者 合同 未 作 明确 约定 
合作 开发 的 软件 可 以 分 割 使 用 的 ， 开 发 者 对 各 自 开 发 的 部 分 可 以 单独 享有 著作 权 ; 但 是 ,行使 
著作 权时 ， 不 得 扩展 到 合作 开发 的 软件 整体 的 著作 权 。 合 作 开发 的 软件 不 能 分 割 使 用 的 ， 其 著 
作 权 由 合作 开发 者 共同 享有 ， 通 过 协商 一 臻 行使， 如 不 能 协商 一 致 ， 又 无 正当 理由 ， 任 何 一 方 
不 得 阻止 他 方 行使 除 转让 权 以 外 的 其 他 权利 ， 但 是 所 得 收益 应 合理 分 配给 所 有 合作 开发 者 。” 

(4) 合作 开发 者 对 于 软件 著作 权 中 的 转让 权 不 得 单独 行使 。 因 为 转让 权 的 行使 将 涉及 软件 
著作 权 权利 主体 的 改变 ， 所 以 软件 的 合作 开发 者 在 行使 转让 权时 ， 必 须 与 各 合作 开发 者 协商 
在 征 得 同意 的 情况 下 方 能 行使 该 项 专 有 权利 。 
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3) 委托 开发 的 软 


件 著作 权 的 归属 


委托 开发 的 软件 作品 属于 著作 权 法 规定 的 委托 软件 作品 。 委托 开发 软件 作品 著作 权 关 系 的 
建立 ， 一 般 由 委托 方 与 受 委托 方 订立 合同 而 成 立 。 委 托 开 发 软件 作品 关系 中 ， 委 托 方 的 责任 主 


要 是 提供 资金 、 设 备 等 物质 条 件 ， 并 不 直接 参与 开发 软件 作品 的 创作 开发 活动 。 受 托 方 的 主要 
责任 是 根据 委托 合同 规定 的 目标 开发 出 符合 条 件 的 软件 。 关 于 委托 开发 软件 著作 权 的 归属 ， 


《计算 机 软件 保护 条 例 


》 第 十 一 条 规定 : “接受 他 人 委托 开发 的 软件 ， 其 著作 权 的 归属 由 委托 


者 与 受 委托 者 签订 书面 合同 约定 ; 无 书面 合同 或 者 合同 未 作 明 确 约定 的 ， 其 著作 权 由 受托 人 享 


有 。”。 根 据 该 条 的 规定 ， 委 托 开发 的 软件 著作 权 的 归属 按 以 下 标准 确定 。 


(1) 委托 开发 软件 作品 须根 据 委托 方 的 要 求 ， 由 委托 方 与 受托 方 以 合同 确定 的 权利 和 义务 
的 关系 而 进行 开发 的 软件 。 因此 , 软件 作品 著作 权 归 属 应 当 作 为 合同 的 重要 条 款 予以 明确 约定 。 
对 于 当事人 已 经 在 合同 中 约定 软件 著作 权 归 属 关系 的 ， 如 事后 发 生 纠纷 ， 软 件 著作 权 的 归属 仍 


应 当 根 据 委托 开发 软件 的 合同 来 确定 。 


(2) 若 在 委托 开发 软件 活动 中 ， 委 托 者 与 受 委托 者 没有 签订 书面 协议 ,或 者 在 协议 中 未 对 
软件 著作 权 归 属 作出 明确 的 约定 , 则 软件 著作 权 属 于 受 委托 者 , 即 属于 实际 完成 软件 的 开发 者 。 


4) 接受 任务 开发 


的 软件 著作 权 的 归属 


根据 社会 经 济 发 展 的 需要 ,对 于 一 些 涉及 国家 基础 项 目 或 者 重点 设施 的 计算 机 软件 ,往往 
采取 由 政府 有 关 部 门 或 上 级 单位 下 达 任务 方式 ， 完 成 软件 的 开发 工作 。 对 于 下 达 任 务 开发 的 软 
件 ， 其 著作 权 的 归属 关系 ，《 计 算 机 软件 保护 条 例 》 第 十 二 条 作出 了 明确 的 规定 : “由 国家 机 
关 下 达 任 务 开发 的 软件 ， 著 作 权 的 归属 与 行使 由 项 目 任务 书 或 者 合同 规定 ; 项 目 任务 书 或 者 合 
同 中 未 作 明确 规定 ， 软 件 著作 权 由 接受 任务 的 法 人 或 者 其 他 组 织 享 有 。” 根 据 该 规定 ， 国 家 或 


上 级 下 达 任 务 开发 的 软件 著作 权 归 属 应 按 以 下 两 条 标准 确定 。 


(1) 下 达 任 务 开发 的 软件 著作 权 的 归属 关系 ， 首 先 应 以 项 目 任务 书 的 规定 或 者 双方 的 合同 


约定 为 准 。 


(2) 下 达 任 务 的 项 目 任务 书 或 者 双方 订立 的 合同 中 未 对 软件 著作 权 归 属 作出 明确 的 规定 或 
者 约定 的 ， 其 软件 著作 权 属于 接受 并 实际 完成 开发 软件 任务 的 单位 。 

5) 计算 机 软件 著作 权 主 体 变更 后 软件 著作 权 的 归属 

计算 机 软件 著作 权 的 主体 ， 因 一 定 的 法 律 事实 而 发 生变 更 。 如 作为 软件 著作 权 人 的 公民 的 
死亡 ， 单 位 的 变更 ， 软 件 著作 权 的 转让 以 及 人 民法 院 对 软件 著作 权 的 归属 作出 裁判 等 。 软 件 著 
作 权 主体 的 变更 必然 引起 软件 著作 权 归 属 的 变化 。 对 此 ，《 计 算 机 软件 保护 条 例 》 也 作 了 一 些 


规定 。 因 计算 机 软件 3 


E 体 变更 引起 的 权 属 变化 有 以 下 几 种 。 


(1) 公民 继承 的 软件 权利 归属 。 


《计算 机 软件 保护 


条 例 》 第 十 五 条 规定 : “在 软件 著作 权 的 保护 期 内 ， 软 件 著作 权 的 继承 


者 可 根据 《中 华人 民 共 和 国 继承 法 》 的 有 关 规 定 ， 继 承 本 条 例 第 八条 项 规定 的 除 署名 权 以 外 的 
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其 他 权利 。” 按 照 该 条 的 规定 ， 软 件 著作 权 的 合法 继承 人 依法 享有 继承 被 继承 人 享有 的 软件 著 
作 权 的 使 用 权 、 使 用 许可 权 和 获得 报酬 权 等 权利 。 继 承 权 的 取得 、 继 承 顺 序 等 均 按照 继承 法 的 
规定 进行 。 

(2) 单位 变更 后 软件 权利 归属 。 

《计算 机 软件 保护 条 例 》 第 十 五 条 规定 : “软件 著作 权 属 于 法 人 或 其 他 组 织 的 ， 法 人 或 其 
他 组 织 变更 、 终 止 后 ， 其 著作 权 在 本 条 例 规定 的 保护 期 内 由 承受 其 权利 义务 的 法 人 或 其 他 组 织 
享有 ; ”按照 该 条 的 规定 ， 作 为 软件 著作 权 人 的 单位 发 生变 更 〈 如 单位 的 合并 、 破 产 等 ) ， 而 
其 享有 的 软件 著作 权 仍 处 在 法 定 的 保护 期 限 内 ， 可 以 由 合法 的 权利 承受 单位 享有 原始 著作 权 人 
所 享有 的 各 项 权利 。 依 法 承受 软件 著作 权 的 单位 ， 成 为 该 软件 的 后 续 著作 权 人 ， 可 在 法 定 的 条 
件 下 行使 所 承受 的 各 项 专 有 权利 。 一 般 认为 ，“ 各 项 权利 ”包括 署名 权 等 著作 人 身 权 在 内 全 部 
权利 。 

(3) 权利 转让 后 软件 著作 权 归 属 。 

《计算 机 软件 保护 条 例 》 第 二 十 条 规定 : “转让 软件 著作 权 的 , 当事人 应 当 订立 书面 合同 。” 
计算 机 软件 著作 财产 权 按照 该 条 的 规定 发 生 转 让 后 ， 必 然 引起 著作 权 主体 的 变化 ,产生 新 的 软 
件 著 作 权 归 属 关系 。 软 件 权利 的 转让 应 当 根 据 我 国有 关 法 规 以 签订 、 执行 书面 合同 的 方式 进行 。 
软件 权利 的 受 让 者 可 依法 行使 其 享有 的 权利 。 

(4) 司法 判决 、 裁 定 引起 的 软件 著作 权 归 属 问题 。 

计算 机 软件 著作 权 是 公民 、 法 人 和 其 他 组 织 享 有 的 一 项 重要 的 民事 权利 。 因 而 在 民事 权利 
行使 、 流 转 的 过 程 中 ， 难 免 发 生 涉及 计算 机 软件 著作 权 作为 标的 物 的 民事 、 经 济 关 系 ， 也 难免 
发 生 争议 和 纠纷 。 争 议和 纠纷 发 生 后 由 人 民法 院 的 民事 判决 、 裁 定 而 产生 软件 著作 权 主 体 的 变 
更 ， 引 起 软件 著作 权 归 属 问题 。 因 司法 裁判 引起 软件 著作 权 的 归属 问题 主要 有 4 类 : 第 一 类 是 
人 民法 院 对 著作 权 归 属 纠纷 中 权利 的 最 终归 属 作出 司法 裁判 ， 从 而 变更 了 计算 机 软件 著作 权 
原 有 归属 ; 第 二 类 是 计算 机 软件 的 著作 权 人 为 民事 法 律 关系 中 的 债务 人 债务 形成 的 原因 可 能 
多 种 多 样 ， 如 合同 关系 或 者 损害 赔偿 关系 等 ) ， 人 民法 院 将 其 软件 著作 财产 权 判 归 债权 人 享有 
抵债 第 三 类 是 人 民法 院 作 出 民事 判决 判 令 软件 著作 权 人 履行 民事 给 付 义务 ， 在 判决 生效 后 执 
行程 序 中 ， 其 无 其 他 财产 可 供 执行 ， 将 软件 著作 财产 权 执 行 给 对 方 折 抵 债务 ， 第 四 类 是 根据 破 
产 法 的 规定 ， 软 件 著作 权 人 被 破产 还 债 ， 软 件 著作 财产 权 作为 法 律 规定 的 破产 财产 构成 的 “其 
他 财产 权利 ”， 作 为 破产 财产 由 人 民法 院 判决 分 配 。 

(5) 保护 期 限 届满 权利 丧失 。 

软件 著作 权 的 法 定 保护 期 限 可 以 确定 计算 机 软件 的 主体 能 否 依法 变更 。 如 果 软 件 著作 权 已 
过 保护 期 ， 该 软件 进入 公有 领域 ， 便 丧失 了 专 有 权 ， 也 就 没有 必要 改变 权利 主体 了 。 根 据 软 件 
保护 条 例 的 规定 ， 计 算 机 软件 著作 权 主 体 变更 必须 在 该 软件 著作 权 的 保护 期 限 内 进行 ， 转 让 活 
动 的 发 生 不 改变 该 软件 著作 权 的 保护 期 。 这 也 就 是 说 ， 转 让 活动 也 不 能 延长 该 软件 著作 权 的 保 
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护 期 限 。 
7. 计算 机 软件 著作 权 侵权 的 鉴别 


侵犯 计算 机 软件 著作 权 的 违法 行为 的 鉴别 ， 主 要 依靠 保护 知识 产权 的 相关 法 律 来 判断 。 违 
反 著 作 权 、 计 算 机 软件 保护 条 例 等 法 律 禁 止 的 行为 ， 便 是 侵犯 计算 机 著作 权 的 违法 行为 ， 这 是 
鉴别 违法 行为 的 本 质 原则 。 对 于 法 律 规定 不 禁止 ， 也 不 违反 相关 法 律 基本 原则 的 行为 ， 不 认为 
是 违法 行为 。 在 法 律 无 明文 具体 条 款 规定 的 情况 下 ， 违 背 著作 权 法 和 计算 机 软件 保护 条 例 等 法 
律 的 基本 原则 ， 以 及 社会 主义 公共 生活 准则 和 社会 善良 风俗 的 行为 ， 也 应 该 视 为 违法 行为 。 在 
一 般 情况 下 ， 损 害 他 人 著作 财产 权 或 人 身 权 的 行为 ， 总 是 违法 行为 。 

1) 计算 机 软件 著作 权 侵 权 行为 

根据 《计算 机 软件 保护 条 例 》 第 二 十 三 条 的 规定 :“ 凡 是 行为 人 主观 上 具有 故意 或 者 过 失 
对 著作 权 法 和 计算 机 软件 保护 条 例 保护 的 计算 机 软件 人 身 权 和 财产 权 实 施 侵 害 行为 的 ， 都 构成 
计算 机 软件 的 侵权 行为 。” 该 条 规定 的 侵犯 计算 机 软件 著作 权 的 情况 ， 是 认定 软件 著作 权 侵 权 
行为 的 法 律 依据 。 计 算 机 软件 侵权 行为 主要 有 以 下 几 种 。 

(1) 未 经 软件 著作 权 人 的 同意 而 发 表 或 者 登记 其 软件 作品 。 软 件 著作 人 享有 对 软件 作品 公 
开发 表 权 ， 未 经 允许 著作 权 人 以 外 的 任何 其 他 人 都 无 权 擅 自发 表 特定 的 软件 作品 。 如 果实 施 这 
种 行为 ， 就 构成 侵犯 著作 权 人 的 发 表 权 。 

(2) 将 他 人 开发 的 软件 当 作 自 己 的 作品 发 表 或 者 登记 。 此 种 行为 主要 侵犯 了 软件 著作 权 的 
开发 者 身份 权 和 署名 权 。 侵 权 行 为 人 欺 世 资 名 ， 惠 窃 软件 开发 者 的 劳动 成 果 ， 将 他 人 开发 的 软 
件 作品 假冒 为 自己 的 作品 而 署名 发 表 。 只 要 行为 人 实施 了 这 种 行为 ， 不 管 其 发 表 该 作品 是 否 经 
过 软件 著作 人 的 同意 ， 都 构成 侵权 。 

(3) 未 经 合作 者 的 同意 将 与 他 人 合作 开发 的 软件 当 作 自己 独立 完成 的 作品 发 表 或 者 登记 。 
此 种 侵权 行为 发 生 在 软件 作品 的 合作 开发 者 之 间 。 作 为 合作 开发 的 软件 ， 软 件 作品 的 开发 者 身 
份 为 全 体 开 发 者 ， 软 件 作品 的 发 表 权 也 应 由 全 体 开 发 者 共同 行使 。 如 果 未 经 其 他 开发 者 同意 ， 
又 将 合作 开发 的 软件 当 作 自 己 的 独创 作品 发 表 ， 即 构成 本 条 规定 的 侵权 行为 。 

(4) 在 他 人 开发 的 软件 上 署名 或 者 更 改 他 人 开发 的 软件 上 的 署名 。 这 种 行为 是 指 在 他 人 
发 的 软件 作品 上 添加 自己 的 署名 ,或 者 替代 软件 开发 者 署名 以 及 或 者 将 软件 作品 上 开发 者 的 署 
名 进行 更 改 的 行为 。 这 种 行为 侵犯 了 软件 著作 人 的 开发 者 身份 权 及 署名 权 。 此 种 行为 与 第 二 条 
规定 行为 的 区 别 主要 是 对 已 发 表 的 软件 作品 实施 的 行为 。 

(5) 未 经 软件 著作 权 人 或 者 其 合法 受 让 者 的 许可 ， 修 改 、 翻 译 其 软件 作品 。 此 种 行为 是 侵 
犯 了 著作 权 人 或 其 合法 受 让 者 的 使 用 权 中 的 修改 权 、 翻 译 权 。 对 不 同 版 本 计算 机 软件 ， 新 版 本 
往往 是 旧版 本 的 提高 和 改善 。 这 种 提高 和 改善 实质 上 是 对 原 软件 作品 的 修改 、 演 绎 。 此 种 行为 
应 征 得 软件 作品 原版 本 著作 权 人 的 同意 ， 否 则 构成 侵权 。 如 果 征 得 软件 作品 著作 人 的 同意 ， 因 
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修改 和 改善 新 增加 的 部 分 ， 创 作者 应 享有 著作 权 。 

(6) 未 经 软件 著作 权 人 或 其 合法 受 让 者 的 许可 ， 复 制 或 部 分 复制 其 软件 作品 。 此 种 行为 侵 
犯 了 著作 权 人 或 其 合法 受 让 者 的 使 用 权 中 的 复制 权 。 计 算 机 软件 的 复制 权 是 计算 机 软件 最 重要 
的 著作 财产 权 ， 也 是 通常 计算 机 软件 侵权 行为 的 对 象 。 这 是 由 于 软件 载体 价格 相对 低廉 ， 复 制 
软件 简单 易 行 效率 极 高 ， 而 销售 非法 复制 的 软件 即 可 获得 高 额 利润 。 因 此 ， 复 制 是 常见 的 侵权 
行为 ， 是 防止 和 打击 的 主要 对 象 。 当 软件 著作 权 经 当事人 的 约定 合法 转让 给 转让 者 以 后 ， 软 件 
开发 者 未 经 允许 不 得 复制 该 软件 ， 否 则 也 构成 本 条 规定 的 侵权 行为 。 

(7) 未 经 软件 著作 权 人 及 其 合法 受 让 者 同意 ， 向 公众 发 行 、 出 租 其 软件 的 复制 品 。 此 种 行 
为 侵犯 了 著作 权 人 或 其 合法 受 让 者 的 发 行 权 与 出 租 权 。 

(8) 未 经 软件 著作 权 人 或 其 合法 受 让 者 同意 , 向 任何 第 三 方 办 理 软件 权利 许可 或 转让 事宜 。 
这 种 行为 侵犯 了 软件 著作 权 人 或 其 合法 受 让 者 的 使 用 许可 权 和 转让 权 。 

(9) 未 经 软件 著作 权 人 及 其 合法 受 让 者 同意 ， 通 过 信息 网 络 传播 著作 权 人 的 软件 。 这 种 行 
为 侵犯 了 软件 著作 权 人 或 其 合法 受 让 者 的 信息 网 络 传播 权 。 

(10) 侵犯 计算 机 软件 著作 权 存 在 着 共同 侵权 行为 。 二 人 以 上 共同 实施 《计算 机 软件 保护 
条 例 》 第 二 十 三 条 和 二 十 四 条 规定 的 侵权 行为 ， 构 成 共同 侵权 行为 。 对 行为 人 并 没有 实施 《 计 
算 机 软件 保护 条 例 》 第 二 十 三 和 二 十 四 条 条 规定 的 行为 ， 但 实施 了 向 侵权 行为 人 进行 侵权 活动 
提供 设备 、 场 所 或 解密 软件 ， 或 者 为 侵权 复制 品 提供 仓储 、 运 输 条 件 等 行为 ， 构 成 共同 侵权 应 
当 在 行为 人 之 间 具 有 共同 故意 或 过 失 。 其 构成 的 要 件 有 两 个 ， 一 是 行为 人 的 过 错 是 共同 的 ， 而 
不 论 行为 人 的 行为 在 整个 侵权 行为 过 程 中 所 起 的 作用 如 何 。 二 是 行为 人 主观 上 要 有 故意 或 过 失 
的 过 错 。 如 果 这 个 要 件 具备 ,各 个 行为 人 实施 的 侵权 行为 虽然 各 不 相同 , 也 同样 构成 共同 侵权 。 
两 个 要 件 如 果 缺 乏 一 个 ， 不 构成 共同 的 侵权 ， 或 者 是 不 构成 任何 侵权 。 

2) 不 构成 计算 机 软件 侵权 的 合理 使 用 行为 

我 国 《计算 机 软件 保护 条 例 》 第 八条 第 四 项 和 第 十 六 条 规定 ,获得 使 用 权 或 使 用 许可 权 ( 视 
合同 条 款 ) 后 ， 可 以 对 软件 进行 复制 而 无 须 通知 著作 权 人 ， 亦 不 构成 侵权 。 对 于 合法 持 有 软件 
复制 品 的 单位 、 公 民 在 不 经 著作 权 人 的 同意 的 情况 下 ， 亦 享有 复制 与 修改 权 。 合 法 持 有 软件 复 
制品 的 单位 、 公 民 ， 在 不 经 软件 著作 权 人 同意 的 情况 下 ， 可 以 根据 自己 使 用 的 需要 将 软件 装 入 
计算 机 ， 为 了 存档 也 可 以 制作 备份 复制 品 ， 为 了 把 软件 用 于 实际 的 计算 机 环境 或 者 改进 其 功能 
时 也 可 以 进行 必要 的 修改 ， 但 是 备份 制品 和 修改 后 的 文本 不 能 以 任何 方式 提供 给 他 人 ， 超 过 以 
上 权利 ， 即 视 为 侵权 行为 。 区 分 合理 使 用 与 非 合理 使 用 的 判别 标准 一 般 有 : 

(1) 软件 作品 是 否 合法 取得 。 这 是 合理 使 用 的 基础 。 

(2) 使 用 目的 是 非 商业 营业 性 , 如 果 使 用 的 目的 是 为 商业 性 营利 , 就 不 属 合理 使 用 的 范围 。 

(3) 合理 使 用 一 般 为 少量 的 使 用 ， 所 谓 少量 的 界限 根据 其 使 用 的 目的 以 行业 惯例 和 人 们 一 
般 常 识 所 综合 确定 。 超 过 通常 被 认为 的 少量 界限 ， 即 可 被 认为 不 属 合理 使 用 。 
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我 国 《计算 机 软件 保护 条 例 》 第 十 七 规定 : “为 了 学 习 和 研究 软件 内 含 的 设计 思想 和 原理 ， 
通过 安装 、 显 示 、 传 输 或 者 存储 软件 的 方式 使 用 软件 的 ， 可 以 不 经 软件 著作 权 人 许可 ， 不 向 其 
支付 报酬 。” 

3) 计算 机 著作 权 软 件 侵权 的 识别 

计算 机 软件 明显 区 别 于 其 他 著作 权 法 保护 的 客体 ， 它 具有 以 下 特点 。 

(1) 技术 性 。 计 算 机 软件 的 技术 性 是 指 其 创作 开发 的 高 技术 性 。 具 有 一 定 规模 的 软件 的 创 
作 开发 ， 一 般 开 发 难度 大 、 周 期 长 、 投 资 高 ， 需 要 良好 组 织 ， 严 密 管理 且 各 方面 人 员 配 合 协作 ， 
借助 现代 化 高 技术 和 高 科技 工具 生产 创作 。 

(2) 依赖 性 。 计算机 程序 的 依赖 性 是 指 人 们 对 其 的 感知 依赖 于 计算 机 的 特性 。 著 作 权 保 护 
的 其 他 作品 一 般 都 可 以 依赖 人 的 感觉 器 官 所 直接 感知 。 但 计算 机 程序 则 不 能 被 人 们 所 直接 感 
知 ， 它 的 内 容 只 能 依赖 计算 机 等 专用 设备 才能 被 充分 表现 出 来 ， 才 能 被 人 们 所 感知 。 

(3) 多 样 性 。 计 算 机 程序 的 多 样 性 是 指 计 算 机 程序 表达 的 多 样 性 。 计 算 机 程序 的 表达 较 著 
作 权 法 保护 的 其 他 对 象 特 殊 ， 其 既 能 以 源 代码 表达 ， 还 可 以 以 目标 代码 和 微 码 等 表达 ， 表 达 形 
式 多 样 。 计 算 机 程序 表达 的 存储 媒体 也 多 种 多 样 ， 同 一 种 程序 分 别 可 以 被 存储 在 纸张 、 磁 盘 、 
磁带 、 光 盘 和 集成 电路 上 等 。 计 算 机 程序 的 载体 大 多 数 精巧 灵 便 。 此 外 ， 计 算 机 程序 的 内 容 与 
表达 难以 严格 区 别 界 定 。 

(4) 运行 性 。 计 算 机 程序 的 运行 性 是 指 计算 机 程序 功能 的 运行 性 。 计 算 机 程序 不 同 于 一 般 
的 文字 作品 ， 它 主要 的 功能 在 于 使 用 。 也 就 是 说 ， 计 算 机 程序 的 功能 只 能 通过 对 程序 的 使 用 、 
运行 才能 充分 体现 出 来 。 计 算 机 程序 采用 数字 化 形式 存储 、 转 换 ， 复 制品 与 原作 品 一 般 无 明显 
区 别 。 

根据 计算 机 软件 的 特点 ， 对 计算 机 软件 侵权 行为 的 识别 可 以 将 发 生 争议 的 某 一 计算 机 程序 
与 比照 物 〈 权 利明 确 的 正版 计算 机 程序 ) 进行 对 比 和 鉴别 ， 从 两 个 软件 的 相似 性 或 完全 相同 来 
判断 ， 做 出 侵权 认定 。 软 件 作品 常常 表现 为 计算 机 程序 的 不 唯一 性 ， 两 个 运行 结果 相同 的 计算 
机 程序 ， 或 者 两 个 计算 机 软件 的 源 代码 程 序 不 相似 或 不 完全 相似 ， 前 者 不 一 定 构成 侵权 ， 而 后 
者 不 一 定 不 构成 侵权 。 


8. 软件 著作 权 侵 权 的 法 律 责任 


当 侵 权 人 侵害 他 人 的 著作 权 财 产权 或 著作 人 身 权 ， 造 成 权利 人 财产 上 的 或 非 财产 的 损失 
侵权 人 不 履行 赔偿 义务 ， 法 律 即 强制 侵权 人 承担 赔偿 损失 的 民事 责任 。 

1) 民事 责任 

侵犯 计算 机 著作 权 以 及 有 关 权 益 的 民事 责任 是 指 公民 、 法 人 或 其 他 组 织 因 侵犯 著作 权 发 生 
的 后 果 依 法 应 承担 的 法 律 责任 。 我 国 《计算 机 软件 保护 条 例 》 第 二 十 三 条 规定 了 侵犯 计算 机 著 
作 权 的 民事 责任 ， 即 侵犯 著作 权 或 者 与 著作 权 有 关 的 权利 的 ， 侵 权 人 应 当 按照 权利 人 的 实际 损 
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失 给 予 赔 偿 ; 实际 损失 难以 计算 的 ， 可 以 按照 侵权 人 的 违法 所 得 给 予 赔偿 。 赔 偿 数 额 还 应 当 包 
括 权 利 人 为 制止 侵权 行为 所 支付 的 合理 开支 。 权 利 人 的 实际 损失 或 者 侵权 人 的 违法 所 得 不 能 确 
定 的 ， 由 人 民法 院 根据 侵权 行为 的 情节 ， 判 决 给予 五 十 万 元 以 下 的 赔偿 。 有 下 列 侵权 行为 的 ， 
应 当 根 据 情况 ， 承 担 停止 侵害 、 消 除 影响 、 公 开 赔 礼 道 歉 、 赔 偿 损 失 等 民事 责任 。 
(1) 未 经 软件 著作 权 人 许可 发 表 或 者 登记 其 软件 的 。 
(2) 将 他 人 软件 当 作 自 己 的 软件 发 表 或 者 登记 的 。 
(3) 未 经 合作 者 许可 ， 将 与 他 人 合作 开发 的 软件 当 作 自己 单独 完成 的 作品 发 表 或 者 登记 的 。 
(4) 在 他 人 软件 上 署名 或 者 涂改 他 人 软件 上 的 署名 的 。 
(5) 未 经 软件 著作 权 人 许可 ， 修 改 、 翻 译 其 软件 的 。 
(6) 其 他 侵犯 软件 著作 权 的 行为 。 
2) 行政 责任 
我 国 《 计 算 机 软件 保护 条 例 》 第 二 十 四 条 规定 了 相应 的 行政 责任 ， 即 对 侵犯 软件 著作 权 行 
为 ， 著 作 权 行政 管理 部 门 应 当 责 令 停止 违法 行为 ， 没 收 非法 记得， 没收 、 销 毁 侵 权 复制 品 ， 并 
可 处 以 每 件 一 百 元 或 者 货 值 金额 二 至 五 倍 的 罚款 。 有 下 列 侵权 行为 的 ， 应 当 根 据 情况 ， 承 担 停 
止 侵害 、 消 除 影响 、 公 开 赔 礼 道 菊 、 赔 偿 损 失 等 行政 责任 。 
(1) 复制 或 者 部 分 复制 著作 权 人 软件 的 。 
(2) 向 公众 发 行 、 出 租 、 通 过 信息 网 络 传播 著作 权 人 的 软件 的 。 
(3) 故意 避 开 或 者 破坏 著作 权 人 为 保护 其 软件 而 采取 的 技术 措施 的 。 
(4) 故意 删除 或 者 改变 软件 权利 管理 电子 信息 的 。 
(5) 许可 他 人 行使 或 者 转让 著作 权 人 的 软件 著作 权 的 。 
3) 刑事 责任 
侵权 行为 触犯 刑律 的 ， 侵 权 者 应 当 承 担 刑事 责任 。 我 国 《刑法 》 第 二 百 一 十 七 条 、 二 百 一 
十 八条 和 二 百 二 十 条 的 规定 ， 构 成 侵犯 著作 权 罪 、 销 售 侵权 复制 品 罪 的 ， 由 司法 机 关 追 究 刑事 
责任 。 
【 例 13.1】 甲 经 销 商 擅自 复制 并 销售 乙 公司 开发 的 OA 软件 光盘 已 构成 侵权 。 丙 企业 
在 未 知 的 情形 下 从 甲 经 销 商 处 购 入 10 张 并 已 安装 使 用 。 在 丙 企 业 知 道 了 所 使 用 的 软件 为 侵 
权 复 制品 的 情形 下 ， 以 下 说 法 正确 的 是 _〈1) 。 
(1) A. 丙 企 业 的 使 用 行为 侵权 ， 须 承担 赔偿 责任 
B. 丙 企 业 的 使 用 行为 不 侵权 ， 可 以 继续 使 用 这 10 张 软 件 光盘 
C. 丙 企 业 的 使 用 行为 侵权 ， 支 付 合 理 费 用 后 可 以 继续 使 用 这 10 张 软件 光盘 
D. 丙 企 业 的 使 用 行为 不 侵权 ， 不 需 承担 任何 法 律 责任 
分 析 : 本 题 正确 的 选项 为 C。 我 国 计 算 机 软件 保护 条 例 第 30 条 规定 “软件 的 复制 品 持 
有 人 不 知道 也 没有 合理 理由 应 当知 道 该 软件 是 侵权 复制 品 的 ， 不 承担 赔偿 责任 ， 但是， 应 
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当 停止 使 用 、 销 毁 该 侵权 复制 品 。 如 果 停 止 使 用 并 销毁 该 侵权 复制 品 将 给 复制 品 使 用 人 造 
成 重大 损失 的 ， 复 制品 使 用 人 可 以 在 向 软件 著作 权 人 支付 合理 费用 后 继续 使 用 .”。 丙 企业 
在 获得 软件 复制 品 的 形式 上 是 合法 的 (向 经 销 商 购买 ), 但 是 由 于 其 没有 得 到 真正 软件 权利 
人 的 授权 ， 其 取得 的 复制 品 仍 是 非法 的 ， 所 以 丙 企业 的 使 用 行为 属于 侵权 行为 。 

软件 复制 品 持 有 人 一 旦 知道 了 所 使 用 的 软件 为 侵权 复制 品 时 ， 应 当 履 行 停止 使 用 、 销 
毁 该 软件 的 义务 。 不 履行 该 义务 ， 软 件 著作 权 人 可 以 诉 请 法 院 判决 停止 使 用 并 销毁 侵权 软 
件 。 如 果 软 件 复制 品 持 有 人 在 知道 所 持 有 软件 是 非法 复制 品 后 继续 使 用 给 权利 人 造成 损失 
的 ， 应 该 承担 赔偿 责任 。 


13.2.3 ”计算 机 软件 的 商业 秘密 权 


关于 商业 秘密 的 法 律 保护 ， 各 国 采 取 不 同 的 立法 例 ， 我 国 反 不 正当 竞争 法 规定 了 商业 秘密 
的 保护 问题 。 


1.， 商业 秘密 


1) 商业 秘密 的 定义 

《 反 不 正当 竞争 》 中 商业 秘密 定义 为 “ 指 不 为 公众 所 知悉 的 、 能 为 权利 人 带 来 经 济 利益 、 
具有 实用 性 并 经 权利 人 采取 保密 措施 的 技术 信息 和 经 营 信 息 ”。 经 营 秘 密 和 技术 秘密 是 商业 秘 
密 的 基本 内 容 。 经 营 秘密 ， 即 未 公开 的 经 营 信息 ， 是 指 与 生产 经 营销 售 活动 有 关 的 经 营 方法 、 
管理 方法 、 产 销 策略 、 货 源 情报 、 客 户 名 单 、 标 底 和 标书 内 容 等 到 专 有 知识 。 技 术 秘 密 ， 即 未 
公开 的 技术 信息 ， 是 指 与 产品 生产 和 制造 有 关 的 技术 诀窍 、 生 产 方案 、 工 艺 流程 、 设 计 图 纸 、 
化 学 配方 、 技 术 情报 等 专 有 知识 。 

2) 商业 秘密 的 构成 条 件 

商业 秘密 的 构成 条 件 是 : 商业 秘密 必须 具有 未 公开 性 ， 即 不 为 公众 所 知悉 ;商业 秘密 必须 
具有 实用 性 ， 即 能 为 权利 人 带 来 经 济 效益 ， 商 业 秘密 必须 具有 保密 性 ， 即 采取 了 保密 措施 。 

一 项 商业 秘密 受到 法 律 保护 的 依据 ,是 必须 具备 上 述 构成 商业 秘密 的 三 个 条 件 ， 当 缺少 上 
述 三 个 条 件 之 一 就 会 造成 商业 秘密 丧失 保护 。 

3) 商业 秘密 权 

商业 秘密 是 一 种 无 形 的 信息 财产 。 与 有 形 财产 相 区 别 ， 商 业 秘密 不 占据 空间 ， 不 易 被 权利 
人 所 控制 ， 不 发 生 有 形 损耗 ， 其 权利 是 一 种 无 形 财产 权 。 

4) 计算 机 软件 与 商业 秘密 

《 反 不 正当 竞争 》 保 护 计算 机 软件 ， 是 以 计算 机 软件 中 是 否 包含 着 “商业 秘密 ”为 必要 条 
件 的。 而 计算 机 软件 是 人 类 知识 、 智 慧 、 经 验 和 创造 性 劳动 的 成 果 ， 本 身 就 具有 商业 秘密 的 特 
征 ， 即 包含 着 技术 秘密 和 经 营 秘密 。 即 使 是 软件 尚未 开发 完成 ， 在 软件 开发 中 所 形成 的 知识 内 


容 也 可 构成 


商业 秘密 。 


2. 计算 机 软件 商业 秘密 的 侵权 


侵犯 商业 秘密 是 指 行为 人 《〈 负 有 约定 的 保密 义务 的 合同 当事人 ; 实施 侵权 行为 的 第 三 人 ; 
商业 秘密 的 行为 人 ) 。 未 经 权利 人 《商业 秘密 的 合法 控制 人 ) 的 许可 ， 以 非法 手段 


侵犯 本 单位 


(包括 直接 从 权利 人 那 


并 加 以 公 
当 竞 争 法 》 


(1) 盗窃 、 利 诱 、 胁 迫 或 其 他 不 了 


或 使 用 ) 。 
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窃取 商业 秘密 并 加 以 公开 或 使 用 ， 通 过 第 三 人 窃取 权利 人 的 商业 秘密 
获取 计算 机 软件 商业 秘密 并 加 以 公开 或 使 用 的 行为 。 根 据 我 国 《 反 不 正 
第 十 条 的 规定 ， 侵 犯 计算 机 软件 商业 秘密 的 具体 表现 形式 主要 有 如 下 几 种 。 
E 当 手段 获取 权利 人 的 计算 机 软件 商业 秘密 。 盗 窃 商 业 秘 


密 , 包括 单位 内 部 人 员 盗窃 、 外 部 人 员 盗窃 、 内 外 勾结 盗窃 等 手段 ; 以 利诱 手段 获取 商业 秘密 ， 
通常 指 行为 人 向 掌握 商业 秘密 的 人 员 提 供 
密 ; 以 胁迫 手段 获取 商业 秘密 ， 是 指 行为 人 采取 威胁 、 强 迫 手段 ， 使 他 人 在 受 强制 的 情况 下 提 


供 商业 秘密 ;以 其 他 不 了 


E 当 手段 获取 商业 秘密 。 


财物 或 其 他 优惠 条 件 ， 诱 使 其 向 行为 人 提供 商业 秘 


(2) 披露 、 使 用 或 允许 他 人 使 用 以 不 正当 手段 获取 的 计算 机 软件 商业 秘密 。 披 露 是 指 将 权 
秘密 向 第 三 人 透 嚣 或 向 不 特定 的 其 他 人 公开 ,使 其 失去 秘密 价值 ， 使 用 或 允许 他 人 
法 使 用 他 人 商业 秘密 的 具体 情形 。 如 果 以 非法 手段 获取 商业 秘密 的 行为 人 将 该 秘密 
再 行 披露 或 使 用 ， 即 构成 双重 的 侵权 ， 倘若 第 三 人 从 侵权 人 那里 获悉 了 商业 秘密 而 将 秘密 披露 
或 使 用 ， 同 样 构成 侵权 。 


利 人 的 商业 
使 用 是 指 非 


(3) 违反 约定 或 违反 权利 人 有 关 保 守 商 业 秘密 的 要 求 ， 披 露 、 使 用 或 允许 他 人 使 用 其 所 掌 


握 的 计算 机 软件 商业 秘密 。 合 法 掌握 计算 机 软件 商业 秘密 的 人 ， 可 能 是 与 权利 人 有 合同 关系 的 


对 方 当事人 ， 也 可 能 是 权利 人 的 单位 了 


[ 作 人 员 或 其 他 知情 人 ， 他 们 违反 合同 约定 或 单位 规定 的 


保密 义务 ， 将 其 所 掌握 的 商业 秘密 擅自 公开 ， 或 自己 使 用 ， 或 许可 他 人 使 用 ， 即 构成 侵犯 商业 


(4) 第 三 人 在 明知 或 应 知 前 述 违 法 行为 的 情况 下 ， 仍 然 从 侵权 人 那里 获取 、 使 用 或 披露 他 
人 的 计算 机 软件 商业 秘密 。 这 是 一 种 间接 的 侵权 行为 。 


3. 计算 机 软件 商业 秘密 侵权 的 法 律 责任 


根据 我 


《 反 不 


政 责任 、 民 事 责任 以 及 刑事 责任 。 
(1) 侵权 者 的 行政 责任 。 我国 《 反 不 J 
对 侵犯 商业 秘密 的 行为 ， 监 督 检查 部 门 应 当 责 令 停 止 违法 行为 ， 而 后 可 以 根据 侵权 的 情节 依法 
处 以 1 万 元 以 上 20 万 元 以 下 的 罚款 。 
(2) 侵权 者 的 民事 责任 。 计 算 机 软件 商业 秘密 的 侵权 者 的 侵权 行为 对 权利 人 的 经 营造 成 经 


E 当 竞争 法 》 和 《刑法 》 的 规定 ， 计 算 机 软件 商业 秘密 的 侵权 者 将 承担 行 


E 当 竞争 法 》 第 二 十 五 条 规定 了 相应 的 行政 责任 ， 即 
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济 上 的 损失 时 ， 侵 权 者 应 当 承担 经 济 损害 赔偿 的 民事 责任 。 我 国 《 反 不 正当 竞争 法 》 第 二 十 条 
规定 了 侵犯 商业 秘密 的 民事 责任 ， 即 经 营 者 违反 该 法 规定 ， 给 被 侵害 的 经 营 者 造成 损害 的 ， 应 
当 承 担 损害 赔偿 责任 。 被 侵害 的 经 营 者 的 合法 权益 受到 损害 的 ， 可 以 向 人 民法 院 提起 诉讼 。 

(3) 侵权 者 的 刑事 责任 。 侵 权 者 以 盗窃 、 利 诱 、 胁 迫 或 其 他 不 正当 手段 获取 权利 人 的 计算 
机 软件 商业 秘密 ; 披露 、 使 用 或 允许 他 人 使 用 以 不 正当 手段 获取 的 计算 机 软件 商业 秘密 ; 违反 
约定 或 违反 权利 人 有 关 保 守 商 业 秘密 的 要 求 ， 披 露 、 使 用 或 允许 他 人 使 用 其 所 掌握 的 计算 机 软 
件 商业 秘密 ， 其 侵权 行为 对 权利 人 造成 重大 损害 的 ， 侵 权 者 应 当 承担 刑事 责任 。 我 国 《刑法 》 
第 二 百 一 十 九条 规定 了 侵犯 商业 秘密 罪 ， 即 实施 侵犯 商业 秘密 行为 ， 给 商业 秘密 的 权利 人 造成 
重大 损失 的 ， 处 3 年 以 下 有 期 徒刑 或 者 拘役 ， 并 处 或 者 单 处 罚金 ， 造 成 特别 严重 后 果 的 ， 处 3 
年 以 上 7 年 以 下 有 期 徒刑 ， 并 处 罚金 。 

【 例 13.2】 某 软件 公司 研发 的 财务 软件 产品 在 行业 中 技术 领先 ， 具 有 很 强 的 市 场 竞争 优 
势 。 为 确保 其 软件 产品 的 技术 领先 及 市 场 竞争 优势 ， 公 司 采 取 相 应 的 保密 措施 ， 以 防止 软件 技 
术 秘密 的 外 泄 。 并 且 ， 还 为 该 软件 产品 冠 以 “用 友 ” 商 标 ， 但 未 进行 商标 注册 。 此 情况 下 ， 
公司 仅 享 有 该 软件 产品 的 _(1) 

(1) A. 软件 著作 权 和 专利 权 B. 商业 秘密 权 和 专利 权 

C. 软件 著作 权 和 商业 秘密 权 D. 软件 著作 权 和 商标 权 

分 析 : 本 题 正确 的 选项 为 C。 由 于 是 软件 公司 研发 的 财务 软件 产品 ， 因 此 ， 软 件 公司 享有 
该 软件 产品 的 软件 著作 权 。 又 由 于 商业 秘密 的 构成 条 件 是 : 商业 秘密 必须 具有 未 公开 性 ， 即 不 
为 公众 所 知悉 ， 商业 秘密 必须 具有 实用 性 ， 即 能 为 权利 人 带 来 经 济 效益 ;商业 秘密 必须 具有 保 
密 性 ， 即 采取 了 保密 措施 。 

综 上 所 述 ， 公 司 仅 享有 该 软件 产品 的 软件 著作 权 和 商业 秘密 权 。 


13.2.4 ”专利 权 概述 


1. 专利 权 的 保护 对 象 与 特征 


发 明 创造 是 产生 专利 权 的 基础 。 发 明 创造 是 指 发 明 、 实 用 新 型 和 外 观 设计 ， 是 我 国 专利 法 
主要 保护 的 对 象 。 我 国 《专利 法 实施 细则 》 第 二 条 第 1 款 规定 : “专利 法 所 称 的 发 明 ， 是 指 对 
产品 、 方 法 或 者 其 改进 所 提出 的 技术 方案 ”。 实 用 新 型 〈 也 称 小 发 明 ) 则 因 国 而 异 ， 我 国 《 专 
利 法 实施 细则 》 第 二 条 第 2 款 规定 : “实用 新 型 是 指 对 产品 的 形状 、 构 造 或 者 其 组 合 所 提出 的 
新 的 技术 方案 ”。 外 观 设计 是 指 对 产品 的 形状 、 图 案 、 色 彩 或 者 它们 的 结合 所 做 出 的 富有 美感 
的 并 适 于 工业 应 用 的 新 设计 。 

专利 的 发 明 创造 是 无 形 的 智力 创造 性 成 果 ， 不 像 有 形 财产 那样 直观 可 见 ， 必 须 经 专利 主管 机 
关 依 照 法 定 程序 审查 确定 ， 在 未 经 审批 以 前 ， 任 何 一 项 发 明 创造 都 不 得 成 为 专利 。 
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下 列 各 项 属于 专利 法 不 适用 的 对 象 ， 因 此 不 授予 专利 权 。 

(1) 违反 国家 法 律 、 社 会 公德 或 者 妨害 公共 利益 的 发 明 创造 。 

(2) 科学 发 现 ， 即 人 们 通过 自己 的 智力 劳动 对 客观 世界 已 经 存在 的 但 未 揭示 出 来 的 规律 、 
性 质 和 现象 等 的 认识 。 

(3) 智力 活动 的 规则 和 方法 ， 即 人 们 进行 推理 、 分 析 、 判 断 、 运 算 、 处 理 、 记 忆 等 思维 活 
动 的 规则 和 方法 。 

(4) 病 的 诊断 和 治疗 方法 。 即 以 活 的 人 或 者 动物 为 实施 对 象 ， 并 以 防 病 治 病 为 目的 ， 是 医 
护 人 员 的 经 验 体现 ， 而 且 因 被 诊断 和 治疗 的 对 象 不 同 而 有 区 别 ， 不 能 在 工业 上 应 用 ， 不 具有 实 
用 性 。 

(5) 动物 和 植物 品种 ， 但 是 动物 植物 品种 的 生产 方法 ， 可 以 依照 专利 法 规定 授予 专利 权 。 

(6) 用 原子 核 变换 方法 获得 的 物质 ， 即 用 核 裂变 或 核 聚 变 方法 获得 的 单质 或 化 合 物 。 


2. 授予 专利 权 的 条 件 


授予 专利 权 的 条 件 是 指 一 项 发 明 创造 获得 专利 权 应 当 具备 的 实质 性 条 件 。 一 项 发 明 或 者 实 
用 新 型 获得 专利 权 的 实质 条 件 为 新 颖 性 、 创 造 性 和 实用 性 。 

(1) 新 颖 性 。 新 颖 性 是 指 在 申请 日 以 前 没有 同样 的 发 明 或 实用 新 型 在 国内 外 出 版 物 公开 发 
表 过 ， 在 国内 公开 使 用 过 或 以 其 他 方式 为 公众 所 知 ， 也 没有 同样 的 发 明 或 实用 新 型 由 他 人 向 专 
利 局 提出 过 申请 并 且 记 载 在 申请 日 以 后 公布 的 专利 申请 文件 中 。 在 某 些 特殊 情况 下 ， 尽 管 申请 
专利 的 发 明 或 者 实用 新 型 在 申请 日 或 者 优先 权 日 前 公开 ， 但 在 一 定 的 期 限 内 提出 专利 申请 的 
仍然 具有 新 颖 性 。 我 国 专利 法 规定 ， 申 请 专利 的 发 明 创造 在 申请 日 以 前 6 个 月 内 ， 有 下 列 情况 
之 一 的 ， 不 丧失 新 颖 性 。 

Q@ 在 中 国政 府 主办 或 者 承认 的 国际 展览 会 上 首次 展 出 的 。 

@ 在 规定 的 学 术 会 议 或 者 技术 会 议 上 首次 发 表 的 。 

@ 他 人 未 经 申请 人 同意 而 泄露 其 内 容 的 。 

(2) 创造 性 。 创造性 是 指 同 申请 日 以 前 已 有 的 技术 相 比 ， 该 发 明 有 突出 的 实质 性 特点 和 显 
著 的 进步 ， 该 实用 新 型 有 实质 性 特点 和 进步 。 例 如 ， 申 请 专利 的 发 明 解决 了 人 们 渴望 解决 但 一 
直 没 有 解决 的 技术 难题 ， 申 请 专利 的 发 明 克 服 了 技术 偏见 ， 申 请 专利 的 发 明 取 得 了 意 想不到 的 
技术 效果 ;申请 专利 的 发 明 在 商业 上 获得 成 功 。 一 项 发 明 专利 是 否 具有 创造 性 ， 前 提 是 该 项 发 
明 具 备 新 颖 性 。 

(3) 实用 性 。 实 用 性 是 指 该 发 明 或 者 实用 新 型 能 够 制造 或 者 使 用 ， 并 且 能 够 产生 积极 的 效 
果 ， 即 不 造成 环境 污染 、 能 源 或 者 资源 的 严重 浪费 ， 损 害 人 体 健 康 。 如 果 申 请 专利 的 发 明 或 者 
实用 新 型 缺乏 技术 手段 申请 专利 的 技术 方案 违背 自然 规律 ; 利用 独一无二 自然 条 件 所 完成 的 
技术 方案 ， 则 不 具有 实用 人 性。 


国 so 若 。 数据 库 系统 工程 师 教程 (第 3 版) 


我 国 专利 法 规定 ， 外 观 设计 获得 专利 权 的 实质 条 件 为 新 颖 性 和 美观 性 。 新 颖 性 是 指 申请 专 
利 的 外 观 设 计 与 其 申请 日 以 前 已 经 在 国内 外 出 版 物 上 公开 发 表 的 外 观 设计 不 相同 或 者 不 相近 
似 ; 与 其 申请 日 前 已 在 国内 公开 使 用 过 的 外 观 设计 不 相同 或 者 不 相近 似 。 美 观 性 是 指 外 观 设计 


被 使 用 在 产品 上 时 能 使 人 产生 一 种 美感 ， 增 加 产品 对 消费 者 的 吸引 力 。 
3. 专利 的 申请 
1) 专利 申请 权 


公民 、 法 人 或 者 其 他 组 织 依据 法 律 规定 或 者 合同 约定 享有 的 就 发 明 创造 向 专利 局 提出 专利 


由 法 律 直接 规 


申请 的 权利 〈 专 利 申请 权 ) 。 一 项 发 明 创造 产生 的 专利 申请 权 归 谁 所 有 ， 主 要 有 


定 的 情况 和 依 合同 约定 的 情况 。 专 利 申请 权 可 以 转让 ， 不 论 专利 申请 权 在 哪 一 个 时 间 段 转让 ， 
原 专利 申请 人 便 因 此 丧失 专利 申请 权 ， 由 受 让 人 获得 相应 的 专利 申请 权 。 专 利 申请 权 可 以 被 继 
承 或 赠与 。 专 利 申请 人 死亡 后 , 其 依法 享有 的 专利 申请 权 可 以 作为 遗产 , 由 其 合法 继承 人 继承 。 


2) 专利 申请 人 


专利 申请 人 是 指 对 某 项 发 明 创造 依法 律 规定 或 者 合同 约定 享有 专利 申请 权 的 公民 、 法 人 或 
者 其 他 组 织 。 专 利 申请 人 包括 职务 发 明 创造 的 单位 ; 非 职务 发 明 创造 的 专利 申请 人 为 完成 发 明 
创造 的 发 明 人 或 者 设计 人 ; 共同 发 明 创造 的 专利 申请 人 是 共同 发 明 人 或 者 设计 人 ,或 者 其 所 属 


单位 ， 委 托 发 明 创造 的 专利 申请 人 为 合同 约定 的 人 ; 受 让 人 。 
3) 专利 申请 的 原则 


专利 申请 人 及 其 代理 人 在 办 理 各 种 手续 时 都 应 当 采 用 书面 形式 。 一 份 专利 申请 文件 只 能 就 
一 项 发 明 创 造 提 出 专利 申请 ， 即 “一 份 申请 一 项 发 明 ” 原 则 。 两 个 或 者 两 个 以 上 的 人 分 别 就 同 


样 的 发 明 创造 申请 专利 的 ， 专 利 权 授 给 最 先 申请 人 。 
4) 专利 申请 文件 


发 明 或 者 实用 新 型 申请 文件 包括 请 求 书 、 说 明 书 、 说 明 书 摘要 和 权利 要 求 书 。 外 观 设计 专 


利 申请 文件 包括 请 求 书 、 图 片 或 照片 。 
5) 专利 申请 日 


专利 申请 日 (也 称 关键 日 是 专利 局 或 者 专利 局 指定 的 专利 申请 受理 代办 处 收 到 完整 专利 


申请 文件 的 日 期 。 如 果 申 请 文件 是 邮寄 的 ， 以 寄 出 的 邮戳 日 为 申请 日 。 
6) 专利 申请 的 审批 


专利 局 收 到 发 明 专 利 申请 后 , 一 个 必要 程序 是 初步 审查 , 经 初步 审查 认为 符合 本 法 要 求 的 ， 
自 申 请 日 起 满 18 个 月 ， 即 行 公布 〈 公 布 申 请 )， 专 利 局 可 根据 申请 人 的 请 求 ， 早 


我 国 专利 法 规定 :“ 实 用 新 型 和 外 观 设计 专利 申请 经 初步 审查 没有 发 现 驳 


局 应 当做 出 授予 实用 新 型 专利 权 或 者 外 观 设计 专利 权 的 决定 ， 发 给 相应 的 专利 证 


回 


日 公布 其 申请 。 
自 申请 日 起 三 年 内 ， 专 利 局 可 以 根据 申请 人 随时 提出 的 请 求 ， 对 其 申请 进行 实质 审查 。 实 质 审 
查 是 专利 局 对 申请 专利 的 发 明 的 新 颖 性 、 创 造 性 和 实用 性 等 依法 进行 审查 的 法 定 程序 。 


理由 的 ， 专 利 


书 ， 并 了 予以 登 
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记 和 公布 ”。 由 此 规定 可 知 ， 对 实用 新 型 和 外 观 设计 专利 申请 只 进行 初步 审查 ， 不 进行 实质 
审查 。 

7) 申请 权 的 丧失 与 恢复 

专利 法 及 其 实施 细则 有 许多 条 款 规定 ,如果 申请 人 在 法 定期 间或 者 专利 局 所 指定 的 期 限 内 
未 办 理 相应 的 手续 或 者 没有 提交 有 关 文 件 ， 其 申请 就 被 视 为 撤回 或 者 丧失 提出 某 项 请 求 的 权 
利 , 或 者 导致 有 关 权 利 终止 后 果 。 因 耽 误 期 限 而 丧失 权利 之 后 , 可 以 在 自 障碍 消除 后 2 个 月 内 ， 
最 迟 自 法 定期 限 或 者 指定 期 限 届满 后 2 年 内 或 者 自 收 到 专利 局 通知 之 日 起 2 个 月 内 ， 请 求 恢 复 
其 权利 。 


4. 专利 权 行 使 


1) 专利 权 的 归属 

根据 《中 华人 民 共和 国 专利 法 》 的 规定 ， 执 行 本 单位 的 任务 或 者 主要 是 利用 本 单位 的 物质 
条 件 所 完成 的 职务 发 明 创造 ， 申 请 专利 的 权利 属于 该 单位 。 申 请 被 批准 后 ， 专 利 权 归 该 单位 持 
有 单位 为 专利 权 人 )。 执 行 本 单位 的 任务 所 完成 的 职务 发 明 创造 是 指 : 

(1) 在 本 职工 作 中 做 出 的 发 明 创造 。 

(2) 履行 本 单位 交付 的 本 职工 作 之 外 的 任务 所 做 出 的 发 明 创造 。 

(3) 工作 变动 退职、 退休 或 者 调 离 ) 后 短期 内 做 出 的 ， 与 其 在 原单 位 承担 的 本 职工 作 或 
者 原单 位 分 配 的 任务 有 关 的 发 明 创 造 。 
本 单位 的 物质 技术 条 件 包括 本 单位 的 资金 、 设 备 、 零 部 件 、 原 材料 或 者 不 对 外 公开 的 技术 
资料 等 。 
非 职 务 发 明 创 造 ， 申 请 专利 的 权利 属于 发 明 人 或 者 设计 人 ; 在 中 国境 内 的 外 资 企 业 和 中 外 
合资 经 营 企业 的 工作 人 员 完 成 的 职务 发 明 创造 ， 申 请 专利 的 权利 属于 该 企业 ， 申 请 被 批准 后 ， 
专利 权 归 申请 的 企业 或 者 个 人 所 有 ; 两 个 以 上 单位 协作 或 者 一 个 单位 接受 其 他 单位 委托 的 研 
究 、 设 计 任务 所 完成 的 发 明 创造 ， 除 另 有 协议 的 以 外 ， 申 请 专利 的 权利 属于 完成 或 者 共同 完成 
的 单位 ， 申 请 被 批准 后 ， 专 利 权 归 申 请 的 单位 所 有 或 者 持 有 。 

2) 专利 权 人 的 权利 

专利 权 是 一 种 具有 财产 权 属 性 的 独占 权 以 及 由 其 衍生 出 来 和 相应 处 理 权 。 专 利 权 人 的 权利 
包括 独占 实施 权 、 转 让 权 、 实 施 许可 权 、 放 弃权 和 标记 权 等 。 专 利 权 人 有 缴纳 专利 年 费 〈 也 称 
专利 维持 费 ) 和 实际 实施 已 获 专利 的 发 明 创造 两 项 基本 义务 。 

专利 权 人 通过 专利 实施 许可 合同 将 其 依法 取得 的 对 某 项 发 明 创造 的 实施 权 转 移 给 非 专利 
权 人 行使 。 任 何 单位 或 者 个 人 实施 他 人 专利 的 ， 除 《中 华人 民 共 和 国 专 利 法 》 第 十 四 条 规定 的 
以 外 ， 都 必须 与 专利 权 人 订立 书面 实施 许可 合同 ， 向 专利 权 人 支付 专利 使 用 费 。 被 许可 人 无 权 
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允许 合同 规定 以 外 的 任何 单位 或 者 个 人 实施 该 专利 。 专 利 实施 许可 的 种 类 包括 独占 许可 、 独 家 
许可 、 普 通 许可 和 部 分 许可 。 


5. 专利 权 的 限制 


根据 《中 华人 民 共 和 国 专利 法 》 的 规定 ， 发 明 专 利 权 的 保护 期 限 为 自 申请 日 起 20 年 ; 实 
用 新 型 专利 权 和 外 观 设计 专利 权 的 保护 期 限 为 自 申 请 日 起 10 年 。 发 明 创造 专利 权 的 法 律 效力 
所 及 的 范围 如 下 。 

(1) 发 明 或 者 实用 新 型 专利 权 的 保护 范围 以 其 权利 要 求 的 内 容 为 准 ， 说 明 书 及 附 图 可 以 用 
于 解释 权利 要 求 。 

(2) 外 观 设计 专利 权 的 保护 范围 以 表示 在 图 片 或 者 照片 中 的 该 外 观 设计 专利 产品 为 准 。 

公告 授予 专利 权 后 ， 任 何 单位 或 个 人 认为 该 专利 权 的 授予 不 符合 专利 法 规定 条 件 的 ， 可 以 
向 专利 复查 委员 会 提出 宣告 该 专利 权 无 效 的 请 求 。 专 利 复审 委员 会 对 这 种 请 求 进 行 审查 ， 做 出 
宣告 专利 权 无 效 或 维持 专利 权 的 决定 。 我 国 专利 法 规定 ， 提 出 无 效 宣告 请 求 的 时 间 〈 启 动 无 效 
宣告 程序 的 时 间 ) 始 于 “ 自 专 利 局 公告 授予 专利 权 之 日 起 ”。 

专利 权 因 某 种 法 律 事实 的 发 生 而 导致 其 效力 消灭 的 情形 称 为 专利 权 终 止 。 导致 专利 权 终 止 
的 法 律 事 实 如 下 。 

(1) 保护 期 限 届满 。 

(2) 在 专利 权 保 护 期 限 届满 前 ， 专 利 权 人 以 书面 形式 向 专利 局 声明 放弃 专利 权 。 

(3) 在 专利 权 的 保护 期 限 内 ， 专 利 权 人 没有 按照 法 律 的 规定 交 年 费 。 专 利 权 终 止 日 应 为 上 
一 年 度 期 满 日 。 

专利 法 允许 第 三 人 在 某 些 特殊 情况 下 ， 可 以 不 经 专利 权 人 许可 而 实施 其 专利 ， 且 其 实施 行 
为 并 不 构成 侵权 的 一 种 法 律 制度 。 专 利 权 限制 的 种 类 包括 强制 许可 、 不 视 为 侵犯 专利 权 的 行为 
和 国家 计划 许可 。 


6. 专利 侵权 行为 


专利 侵权 行为 是 指 在 专利 权 的 有 效 期 限 内 ， 任 何 单位 或 者 个 人 在 未 经 专利 权 人 许可 ， 也 没 
有 其 他 法 定 事由 的 情况 下 ， 擅 自 以 营利 为 目的 实施 专利 的 行为 。 专 利 侵权 行为 主要 包括 如 下 
方面 。 

(1) 为 生产 经 营 目的 制造 、 使 用 、 销 售 其 专利 产品 ， 或 者 使 用 其 专利 方法 以 及 使 用 、 销 售 
依照 该 专利 方法 直接 获得 的 产品 。 

(2) 为 生产 经 营 目的 制造 、 销 售 其 外 观 设计 专利 产品 。 

(3) 进口 依照 其 专利 方法 直接 获得 的 产品 。 

(4) 产品 的 包装 上 标明 专利 标记 和 专利 号 。 
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(5) 用 非 专利 产品 冒充 专利 产品 的 或 者 用 非 专利 方法 冒充 专利 方法 等 。 

对 未 经 专利 权 人 许可 ， 实 施 其 专利 的 侵权 行为 ， 专 利 权 人 或 者 利害 关系 人 可 以 请 求 专利 管 
理 机 关 处 理 。 在 专利 侵权 纠纷 发 生 后 , 专利 权 人 或 者 利害 关系 人 既 可 以 请 求 专利 管理 机 关 处 理 ， 
又 可 以 请 求人 民法 院 审理 。 侵 犯 专利 权 的 诉讼 时 效 为 2 年 ， 自 专利 权 人 或 者 利害 关系 人 知道 或 
者 应 当知 道 侵 权 行 为 之 日 起 计算 。 如 果 诉讼 时 效 期 限 届满 ， 专 利 权 人 或 者 利害 关系 人 不 能 再 请 
求人 民法 院 保护 ， 同 时 也 不 能 再 向 专利 管理 机 关 请 求 保护 。 

【 例 13.3】 李 某 在 某 软件 公司 兼职 ， 为 完成 该 公司 交 给 的 工作 ， 做 出 了 一 项 涉及 计算 机 程 
序 的 发 明 。 李 某 认为 该 发 明 是 自己 利用 业余 时 间 完成 的 ， 可 以 个 人 名 义 申 请 专利 。 关 于 此 项 发 
明 的 专利 申请 权 应 归属 _CL) 。 

(1) A. 李 某 B. 李 某 兼职 的 软件 公司 

C. 李 某 所 在 单位 D. 李 某 和 软件 公司 约定 的 一 方 

分 析 : 本 题 正确 的 选项 为 B。 根 据 《 专 利 法》 第 6 条 第 1 款 规 定 ， 执 行 本 单位 的 任务 所 完 
成 的 发 明 创造 是 职务 发 明 创造 。 职 务 发 明 创造 申请 专利 的 权利 属于 单位 ， 申 请 被 批准 后 ， 该 单 
位 为 专利 权 人 。《 专 利 法 实施 细则 》 第 11 条 对 “执行 本 单位 的 任务 所 完成 的 发 明 创造 ”作出 了 
解释 : (1) 在 本 职工 作 中 作出 的 发 明 创造 ;，(2) 履行 本 单位 交付 的 本 职工 作 之 外 的 任务 所 作出 
的 发 明 创 造 ，(3〉 退职 、 退 休 或 者 调动 工作 后 一 年 内 所 作出 的 ， 与 其 在 原单 位 承担 的 本 职工 作 
或 原单 位 分 配 的 任务 有 关 的 发 明 创造 。 李 某 是 为 完成 其 兼职 软件 公司 交 给 的 工作 而 作出 的 该 项 
发 明 ， 属 于 职务 发 明 。 专 利 申请 权 应 归属 软件 公司 。 

专利 法 第 6 条 第 3 款 规定 : “利用 本 单位 的 物质 技术 条 件 所 完成 的 发 明 创造 ， 单 位 与 发 明 
人 或 者 设计 人 订 有 合同 ， 对 申请 专利 的 权利 和 专利 权 的 归属 作出 约定 的 ， 从 其 约定 。” 在 事先 
有 约定 的 情况 下 ， 按 照 约定 确定 权 属 。 如 果 单 位 和 发 明 人 没有 对 权 属 问题 作出 约定 或 约定 不 明 
的 ， 该 发 明 创 造 仍 视 为 职务 发 明 创造 ， 专 利 申请 权 仍然 属于 单位 。 
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14.1 ”SQL 应 用 案例 
14.1.1 SQL 应 用 案例 一 


某 网 上 书店 后 台数 据 库 的 部 分 关系 模式 如 下 : 


会 员 (会 员 编 号 ， 用户 名 ， 密 码 ， 姓 名 ， 地 址 ， 邮 编 ， 电 话 ， 消 费 额 ， 积 分 ) 
图 书 (图 书 编号 ， 类 型 名 称 ， 图 书 名 称 ， 作 者 ， 出 版 社 ， 出 版 日 期 ISBN， 价 格 ) 


订单 (订单 编号 ， 用 户 名 ， 销 售 额 ， 订 购 日 期 ， 出 货 日 期 
订单 明细 订单 明细 编号 ， 订 单 编号 ， 图 书 编号 ， 数 量 》 


【问题 1】 下 面 是 创建 订单 关系 的 SQL 语句 ， 订 单 编号 唯一 识别 一 个 订单 ， 用 户 名 为 订购 


图 书 的 会 员 用户 名 ， 且 不 能 为 室 。 要 求 订购 日 期 不 能 大 于 出 货 日 期 。 请 将 空缺 部 分 补充 完整。 
CREATE TABLE 订单 ( 


订单 编号 CHAR(6) (a) z 
用 户 名 VARCHAR(40) NOT NULL (b) 
销售 额 FLOAT ， 
订购 日 期 DATE NOT NULL， 

出 货 日 期 DATE_ (Ce) ); 


【问题 2】 请 完成 下 列 查询 的 SQL 语句 。 


(1) 查询 名 称 中 包含 “数据 库 ” 的 图 书 的 图 书 名 称 ， 作 者 ， 出 版 社 和 出 版 日 期 。 
SELECT (d) 


FROM 图 书 
WHERE 图 书 名称 Ce) 


(2) 查询 提供 销售 (图 书 表 中 有 ) 但 没有 销售 过 ( 没 在 订单 明细 表 中 出 现 ) 的 图 书 名 称 和 
出 版 社 


SELECT 图 书 名 称 , 出 版 社 
FROM 图 书 
WHERE NOTEXISTS ( 
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SELECT (9 
FROM 订单 明细 
WHERE (g) 3 
(3) 查询 订购 图 书 数量 最 多 的 会 员 名 及 其 订购 的 数量 。 
SELECT 用 户 名 ， Ch) 
FROM 订单 ,订单 明细 
WHERE (iD 
GROUP BY 用 户 名 
HAVING (ji) 
(SELECT SUM( 数 量 ) 
FROM 订单 ,订单 明细 
WHERE 订单 .订单 编号 = 订单 明细 .订单 编号 
GROUP BY 用 户 名 ); 
(4) 为 了 统计 会 员 的 购买 行为 信息 ， 实 施 有 意义 的 客户 关怀 策略 ， 查 询 会 员 的 平均 订购 间 
隔 时 间 ， 考 虑 多 次 购买 图 书 和 一 次 购买 图 书 的 情况 (其 中 ，DATEDIFF 函数 表示 两 个 日 期 之 间 


的 天 数 )。 
SELECT 用 户 名 , CASE WHEN (k) 
THEN DATEDIFF(MAX( 订 购 日 期 ), MIN( 订 购 日 期 ))/ (CD 
ELSE DATEDIFF (CURRENT_TIMESTAMP, MIN( 订 购 日 期 ) 
END AS AVG_GAP 
FROM 订单 
(my) ; 


【问题 3】 会 员 订 购 图 书后 ， 将 本 次 订购 的 销售 额 累加 到 该 会 员 的 消费 额 中 ， 并 按照 本 次 
订单 的 销售 额 计算 积分 累加 到 该 会 员 的 积分 中 (每 20 元 增加 1 个 积分 ,不 足 20 元 不 计 入 积分 )。 
下 面 用 触发 器 实现 该 需求 ， 请 填充 空缺 部 分 。 

CREATE TRIGGER 会 员 积 分 _TRIGGER AFTER Cn) 
REFERENCING NEW ROW AS NROW 
BEGIN 
UPDATE 会 员 
SET 消费 额 = 消费 额 + NROW. 销 售 额 ， (0) 
WHERE 用 户 名 =NROW. 用 户 名 
END 
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应 用 案例 一 分 析 


【问题 1】 分 析 : 问题 1 主要 涉及 SQL 完整 性 约束 方面 的 基础 知识 。 完 整 性 约束 包括 三 类 ， 


实体 完整 性 、 参 照 完整 性 和 用 户 定义 的 完整 性 。 实体 完整 性 约束 规定 关系 的 3 


关系 模型 中 以 主 码 作为 唯一 性 标示 。 


属性 不 能 取 空 值 ， 


空 (a) 涉及 的 是 实体 完整 性 的 应 用 ， 订 单 编号 是 订单 关系 的 主键 ， 用 PRIMARY KEY 关 


键 字 ， 亦 可 用 NOTNULL UNIQUE 或 UNIQUE NOT NULL 来 保证 一 个 订单 


标号 唯一 识别 一 个 


订单 ;参照 完整 性 约束 规定 若 属性 〈 或 属性 组 ) A 是 关系 R 上 的 主 码 ，B 是 关系 S$ 上 的 外 码 ， 


A 与 B 相对 应 〈 来 自 相同 的 域 )， 则 B 取 值 为 空 或 者 来 自 于 R 上 的 某 个 A 的 值 。 


空 (b) 涉及 的 是 参照 完整 性 的 应 用 ， 用 户 名 属性 对 应 于 会 员 关 系 的 用 户 名 属性 ， 定 义 语 


法 为 REFERENCES 会 员 (用户 名 )， 由 于 两 个 关系 中 的 属性 名 一 致 
REFERENCES 会 员 定义 ;用 户 定义 的 完整 性 约束 是 针对 有 具体 的 数据 库 应 用 
该 应 用 所 涉及 的 数据 必须 满足 用 户 定义 的 语义 要 求 。 

空 (c) 涉及 的 是 用 户 定义 的 完整 性 约束 的 应 用 ， 要 求 出 货 日 期 必须 大 


出 货 日 期 )， 此 处 ，chk_date 可 以 为 其 他 的 约束 名 。 
【问题 2】 分 析 : 问题 2 涉及 查询 语句 SELECT 的 语法 基础 知识 。 其 
涉及 的 知识 要 点 如 下 所 述 。 


， 因 此 也 可 以 用 
而 定义 的 ， 它 反映 


于 等 于 订购 日 期 ， 


因此 答案 为 CHECK( 订 购 日 期 < 出 货 日 期 ) 或 CONSTRAINT chk date CHECK( 订 购 日 期 <= 


中 (1) 一 (4) 所 


(1) 基本 的 SQL 查询 语法 。SELECT 后 是 要 查询 的 属性 ， 查 询 条 件 是 包含 “数据 库 ” 的 图 


书 ， 因 此 用 LIKE 关键 字 。 


(2) NOT EXISTS 语法 。(f) 处 填 *。 该 查询 为 相关 查询 ， 因 此 〈g) 处 的 条 件 为 图 书 .图 书 


编号 = 订单 明细 .图 书 编号 。 
(3) 涉及 较 复 杂 的 媒 套 查询 、 分 组 查询 和 ALL 关键 字 。 子 查询 得 到 所 


有 会 员 的 订购 数 ， 


题目 要 求 查询 订购 数 最 多 的 会 员 名 和 订购 数 ， 因 此 〈j) 的 答案 为 SUM (数量) >=ALL。 


(4) 分 组 查询 、 聚 集 函 数 和 CASE 语法 。 平 均 订购 间隔 时 间 对 一 次 购买 
有 不 同 的 计算 方式 ， 对 一 次 购买 的 会 员 ， 平 均 订购 时 间 为 当前 时 间 - 订 购 时 


和 多 次 购买 的 会 员 
间 ; 而 对 于 多 次 购 


买 的 会 员 , 平均 订购 时 间 为 (最 晚 的 订购 时 间 - 最 早 的 订购 时 间 ) /间隔 数 ， 间 隔 数 为 订购 数 -1。 


【问题 3】 分 析 : 问题 3 涉及 SQL 的 触发 器 机 制 应 用 方面 的 知识 。 触 发 
而 执行 的 ， 事 件 指 的 是 对 某 个 关系 的 插入 、 删 除 或 更 新 ， 当 触发 器 被 事件 激 
执行 ， 而 是 检测 触发 器 的 条 件 ， 若 条 件 满足 则 执行 触发 器 定义 的 动作 。 因 此 
时 ， 必 须 指定 : 触发 器 名 称 、 在 其 上 定义 触发 器 的 关系 〔 表 )、 触 发 器 将 何 


器 是 通过 事件 触发 
活 时 ， 并 不 是 立即 
， 创 建 一 个 触发 器 
时 激发 、 触 发 器 执 


行 时 应 做 的 动作 。 本 题 中 触发 器 定义 的 事件 为 会 员 订 购 图 书 ， 即 插入 一 个 订单 记录 ， 因 此 (n) 


的 答案 为 INSERT ON 订单 。 执 行 的 动作 是 累加 会 员 的 消费 额 ， 并 按照 规则 


把 本 次 订单 的 销售 


额 计算 为 积分 ， 更 新 会 员 的 积分 ， 因 此 (0) 的 答案 为 积分 = 积分 +INT( NROW. 销 售 额 / 20 )。 
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案例 一 参考 答案 
【问题 1】 
(a) PRIMARY KEY 或 NOTNULL UNIQUE 或 UNIQUE NOT NULL 
(b) ” REFERENCES 会 员 (用 户 名 ) ”或 REFERENCES 会 员 
(c) CHECK (订购 日 期 <= 出 货 日 期 ) 或 
CONSTRAINT chk_date CHECK (订购 日 期 <= 出 货 日 期 ) 
( 注 : chk_date 可 为 其 他 名 称 ) 


【问题 2】 
(1)(d) 图 书 名 称 , 作者 ， 出 版 社 ， 出 版 日 期 
(e) LIKE '% 数 据 库 %' 
(C2) (有 
(g) 图 书 . 图 书 编号 = 订单 明细 .图 书 编号 
(3) (h) SUM( 数 量 ) 
(i) 订单 . 订单 编号 = 订单 明细 .订单 编号 
(j) SUM( 数 量 ) >= ALL 
(4) (k) COUNT(*)>1 
(1) (COUNT(*)-1) 或 COUNT(*) 也 给 分 
(m) GROUP BY 用 户 名 
【问题 3】 
(Cn) INSERT ON 订单 
(0) 积分 = 积分 + INT(NROW. 销 售 额 /20 ) 


14.1.2 ”SQL 应 用 案例 二 
北京 市 某 银行 信息 系统 的 数据 库 部 分 关系 模式 如 下 所 示 : 


， 姓 名 ， 性 别 ， 地 址 ， 邮 编 ， 电 话 ) 
， 客 户 号 ， 开 户 支行 号 ， 余 额 ) 


， 支 行 名 称 ， 城 市 ， 资 产 总 额 ) 
， 账 户 号 ， 业 务 金额 ， 交 易 日 期 ) 


其 中 ， 业 务 金额 为 正 值 表示 客户 向 账户 存款 ;为 负 值 表示 取款 。 

【问题 1】 以 下 是 创建 账户 关系 的 SQL 语句 ， 账 户 号 唯一 识别 一 个 账户 ， 客 户 号 为 客户 关 
系 的 唯一 标识 ， 且 不 能 为 空 。 账 户 余额 不 能 小 于 1.00 元 。 请 将 空缺 部 分 补充 完整 。 

CREATE TABLE 账户 ( 
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账户 号 CHAR(19) (a) 
客户 号 CHAR(10) (b) 
开户 支行 号 CHAR(6) ”NOT NULL， 
余额 NUMBER(8,2) (c) x 


【问题 2】 
(1) 现 银行 决策 者 希望 查看 在 天 津 市 各 支行 开户 且 2016 年 9 月 使 用 了 银行 存 取 服 务 的 所 
有 客户 的 详细 信息 ， 请 补充 完整 相应 的 查询 语句 。( 交 易 日 期 形式 为 2000-01-01’) 

SELECT DISTINCT 客户 .* 
FROM 客户 , 账户 , 支行 , 交易 
WHERE 客户 .客户 号 = 账户 .客户 号 AND 

账户 .开户 支行 号 = 支行 .支行 号 AND 

(d) AND 
交易 .账户 号 = 账户 .账户 号 AND 
(e) 

上 述 查询 优化 后 的 语句 如 下 ， 请 补充 完整 。 
SELECT DISTINCT 客户 .* 
FROM 客户 , 账户 ， (CD) AS 新 支行 ， Cg) AS 新 交易 
WHERE 客户 .客户 号 = 账户 .客户 号 AND 

账户 .开户 支行 号 = 新 支行 .支行 号 AND 

新 交易 .账户 号 = 账户 .账户 号 ; 
(2) 假定 一 名 客户 可 以 申请 多 个 账户 ， 给 出 在 该 银行 当前 所 有 账户 余额 之 和 超过 百 万 的 客 

户 信息 并 按 客户 号 降序 排列 。 

SELECT * 
FROM 客户 
WHERE Ch) 
(SELECT 客户 号 FROM 账户 GROUP BY 客户 号 (iD ) 
ORDER BY (6) ; 


【问题 3】 

(1) 为 账户 关系 增加 一 个 属性 “账户 标记 ”， 缺 省 值 为 0， 取 值 类 型 为 整数 ， 并 将 当前 账户 
关系 中 所 有 记录 的 “账户 标记 ”属性 值 修改 为 0。 请 补充 相关 SQL 语句 。 

ALTER TABLE 账户 (k) DEFAULT 0; 


UPDATE 账户 (D ; 
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(2) 对 于 每 笔 金 额 超过 10 万 元 的 交易 ， 其 对 应 账户 标记 属性 值 加 1， 触 发 器 实现 的 方案 如 
下 ， 请 将 空 (m)、(m) 和 (0) 补 充 完整 。 
CREATE TRIGGER 交易 触发 器 (m) ON 交易 
REFERENCING NEW ROW AS 新 交易 
FOR EACH ROW 
WHEN Cn) 
BEGIN ATOMIC 
UPDATE 账户 SET 账户 标记 = 账户 标记 + 1 
WHERE (0) : 
COMMIT WORK ; 


END 

案例 二 分 析 

此 案例 要 求 掌 握 SQL 语句 的 基本 语法 和 结构 ， 认 真 阅读 题目 给 出 的 关系 模式 ， 针 对 题目 的 
要 求 具体 分 析 并 解答 。 由 于 案例 已 经 给 出 了 4 个 关系 模式 ， 需 要 分 析 每 个 实体 的 属性 特征 及 实 
体 之 间 的 联系 ， 补 充 完整 SQL 语句 。 

【问题 1】 分 析 : 由 “账户 号 唯一 识别 一 个 账户 ”可 知 账户 号 为 账户 关系 的 主 属性 ， 即 不 
能 为 空 且 唯 一 标识 一 条 账户 信息 。 由 “客户 号 为 客户 关系 的 唯一 标识 ， 且 不 能 为 空 ”可 知客 户 
号 为 客户 关系 的 主 属性 ， 在 账户 关系 中 作 外 关键 字 ， 由 “账户 余额 不 能 小 于 1.00 元 ”可 知 需要 
限制 账户 余额 属性 值 的 范围 ， 通 过 CHECK 约束 来 实现 。 

CREATE TABLE 账户 ( 

长 户 号 CHAR(19) PRIMARY KEY, 
客户 号 CHAR(10) FOREIGN KEY (客户 号 ) REFERENCES 客户 (客户 号 )， 
开户 支行 号 CHAR(6) ”NOT NULL， 
余额 NUMBER(8,2) CHECK (余额 >1.00) ); 
注 : PRIMARY KEY 可 替换 为 NOT NULL UNIQUE 或 NOT NULL PRIMARY KEY。 

【问题 2】 分析: 问题 2 是 通过 SQL 查询 语句 SELECT 实现 的 。 

(1) 要 求 在 表 连 接 条 件 的 基础 上 ， 需 要 添加 两 个 条 件 : @D 支 行 关系 的 城市 属性 值 为 “天 津 
市 ”, 即 支 行 .城市 = 天津 市 '; @ 在 2016 年 9 月 存在 交易 记录 , 由 于 交易 日 期 形式 为 ‘2000-01-01”， 
所 以 需要 通过 模糊 匹配 来 实现 ， 用 LIKE 关键 词 和 通配符 表示 ， 即 交易 .交易 日 期 LIKE 
‘2016-09%’。 

WHERE 子 句 中 条 件 的 先后 顺序 会 对 执行 效率 产生 影响 。 假 如 解析 器 是 按照 先后 顺序 依次 
解析 并 列 条 件 ， 优 化 的 原则 是 : 表 之 间 的 连接 必须 出 现在 其 他 WHERE 条 件 之 后 ， 那 些 可 以 过 
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滤 掉 最 多 条 记录 的 条 件 尽 可 能 出 现在 WHERE 子 句 中 其 他 条 件 的 前 面 。 要 实现 上 述 优化 过 程 ， 
可 以 重新 组 织 WHERE 条 件 的 顺序 或 者 通过 子 查询 以 缩小 连接 记录 数目 的 规模 来 实现 。 
根据 题目 要 求 ， 考 生 需 要 添加 两 个 子 查询 以 缩小 参与 连接 的 记录 的 数目 ， 即 筛选 出 天 津 市 
的 所 有 支行 (SELECT * FROM 支行 WHERE 城市 = ' 天 津 市 ')， 而 且 找到 2016 年 9 月 发 生 的 
交易 记录 (SELECT * FROM 交易 WHERE 交易 日 期 LIKE “2016-09%*), 然后 再 做 连接 查询 。 
(2) 要 求 通过 子 查询 即 可 实现 “所 有 账户 余额 之 和 超过 百 万 的 客户 信息 ”的 查询 ; 对 SUM 
函数 计算 的 结果 通过 HAVING 指令 附加 约束 条 件 ， 降 序 通过 DESC 关键 字 来 实现 。 
SELECT * 
FROM 客户 
WHERE 客户 号 IN 
(SELECT 客户 号 FROM 账户 GROUP BY 客户 号 HAVING SUM( 余 额 ) > 1000000.00 ) 
ORDER BY 客户 号 DESC ; 
【问题 3】 分 析 : 问题 3 涉及 关系 模式 的 修改 和 创建 触发 器 的 知识 内 容 。 
(1) 关系 模式 的 修改 通过 ALTER 语句 来 实现 ， 利 用 ADD 指令 添加 属性 ; 利用 SET 指令 
修改 属性 值 。 
ALTER TABLE 账户 ADD 账户 标记 INT DEFAULT0; 
UPDATE 账户 SET 账户 标记 =0; 
(2) 创建 触发 器 通过 CREATE TRIGGER 语句 实现 。 按 照 案例 要 求 ， 在 交易 关系 中 插入 一 
条 记录 时 ， 触 发 器 会 自动 执行 ， 需 要 创建 基于 INSERT 类 型 的 触发 器 ， 触 发 条 件 是 新 插入 交易 
记录 的 金额 属性 值 > 100000.00; 最 后 是 添加 表 连 接 条 件 。 
CREATE TRIGGER 交易 触发 器 AFTER INSERT ON 交易 
REFERENCING NEW ROW AS 新 交易 
FOR EACH ROW 
WHEN 新 交易 .金额 > 100000.00 
BEGIN ATOMIC 
UPDATE 账户 SET 账户 标记 = 账户 标记 + 1 
WHERE 账户 .账户 号 = 新 交易 .账户 号 ; 
COMMIT WORK ; 


END 
案例 二 参考 答案 
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【问题 1】 

(a) PRIMARY KEY/NOT NULL UNIQUE/NOT NULL PRIMARY KEY 
(b) FOREIGN KEY (客户 号 ) REFERENCES 客户 (客户 号 ) 

(c) CHECK (余额 >1.00) 


【问题 2】 
(1) (qd) 支行 .城市 = ‘天 津 市 * 
(e) 交易 .交易 日 期 LIKE ‘2016-09%?。 注 : (d) (e) 次 序 无 关 


(f) (SELECT* FROM 支行 WHERE 城市 = ' 天 津 市 ') 
(g) (SELECT * FROM 交易 WHERE 交易 日 期 LIKE “2009-09%’) 
(2) (h) 客户 号 IN 
(i) HAVING SUM( 余 额 ) > 1000000.00 
(j) 客户 号 DESC 
【问题 3】 
(1) (k) ADD 账户 标记 INT 
(1) SET 账户 标记 = 0; 
(2) (m) AFTER INSERT 
Cn) 新 交易 .金额 > 100000.00 
(0) 账户 .账户 号 = 新 交易 .账户 号 


14.2 ”数据 库 设 计 应 用 案例 


14.2.1 高 校 实验 室 管理 信息 系统 

某 高 校 拟 开发 一 套 实验 室 管理 信息 系统 ， 以 便 对 各 课程 的 实验 安排 进行 有 效 的 管理 。 

1. 需求 分 析 

每 个 实验 室 可 进行 的 实验 类 型 不 同 。 由 于 实验 室 和 实验 员 资源 有 限 ， 需 根据 学 生 人 数 分 批 
次 安排 实验 室 和 实验 员 。 一 门 含 实验 的 课程 可 以 开设 给 多 个 班级 ， 每 个 班级 每 学 期 可 以 开设 多 
门 含 实验 的 课程 。 每 个 实验 室 都 有 其 可 开设 的 实验 类 型 。 一 门 课程 的 一 种 实验 可 以 根据 人 数 、 


实验 室 的 可 容纳 人 数 和 实验 室 类 型 ， 分 批 次 开设 在 多 个 实验 室 的 不 同时 间 段 。 一 个 实验 室 的 一 
次 实验 可 以 分 配 多 个 实验 员 负 责 辅导 实验 ， 实 验 员 给 出 学 生 的 每 次 实验 成 绩 。 
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(1) 课程 信息 包括 : 课程 编号 、 课 程 名 称 、 实 验 学 时 、 授 课 学 期 和 开课 的 班级 等 信息 ; 实 
验 信息 记录 该 课程 的 实验 进度 信息 ， 包 括 : 实验 名 、 实 验 类 型 、 学 时 、 安 排 周 次 等 信息 ， 如 表 
14-1 所 示 。 


表 14-1 课程 及 实验 信息 


课程 名 称 | 数字 电视 原理 
六 rea 
a - 


课程 编号 


第 三 学 期 


序号 安排 周 次 
1505403701 实验 AD 音 视 频 3 
1505403702 音频 编码 实验 答 证 性 5 


1505403703 视频 编码 实验 


(2) 以 课程 为 单位 制订 实验 安排 计划 信息 ， 包 括 : 实验 地 点 、 实 验 时 间 、 实 验 员 等 信息 。 
实验 计划 如 表 14-2 所 示 。 


表 14-2 计划 安排 实验 


课程 编号 220 
实验 编号 TE ET 人 数 


1505403701 | 60 
1505403701 1 | 2 | 60 
1505403701 末 J | 3 | 6 
1505403701 -DA 实 开 40 
1505403702 | 音频 编码 实验 ET 70 


(3) 由 实验 员 给 出 每 个 学 生 每 次 实验 的 成 绩 ， 包 括 : 实验 名 、 学 号 、 姓 名 、 班 级 、 实 验 成 
绩 等 信息 。 实 验 成 绩 如 表 14-3 所 示 。 


表 14-3 实验 成 绩 实验 员 : 盛 义 


实验 名 音 视频 AD-DA 实验 课程 名 数字 电视 原理 


学 号 姓名 班级 实验 成 绩 
030501001 陈 民 信 0501 | 87 
030501002 刘 志 信 0501 78 


张 勤 信 0501 


86 


040501001 


(4) 学 生 的 实验 课程 总 成 绩 根 据 每 次 实验 的 成 绩 以 及 每 次 实验 的 难度 来 计算 。 


2. 概念 模型 设计 
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根据 需求 阶段 收集 的 信息 ， 设 计 的 实体 联系 图 〈 不 完整 ) 如 图 14-1 所 示 。 


图 14-1 实体 联系 图 


3. 逻辑 结构 设计 


根据 概念 模型 设计 阶段 完成 的 实体 联系 图 ， 得 出 如 下 关系 模式 (不 完整 ); 


课程 (课程 编号 ， 课 程 名 称 ， 授 课 院 系 ， 实 验 学 时 ) 

班级 (班级 号 ， 专业， 所 属 系 ) 

开课 情况 (_ (UU)  ， 授课 学 期 

实验 ( (2) ， 实 验 类 型 ， 难 度 ， 学 时 ， 安 排 周 次 
实验 计划 (- (3) _， 实 验 时 间 ， 人 数 ) 

实验 员 ( (4)  _， 级别) 

实验 室 〈 实 验 室 编号 ， 地 点 ， 开 放 时 间 ， 可 容纳 人 数 ， 实 验 类 型 ) 
学 生 (5) ， 姓 名 ， 年 龄 ， 性 别 》 

实验 成 绩 (_ (6) ， 实 验 成 绩 ， 评 分 实验 员 ) 


【问题 1】 补 充 图 14-1 中 的 联系 和 联系 的 类 型 。 

【问题 2】 根 据 图 14-1， 将 逻辑 结构 设计 阶段 生成 的 关系 模式 中 的 空 (1) 一 〈6) 补充 完 
整 。 对 所 有 关系 模式 ， 用 下 画 线 标 出 各 关系 模式 的 主键 。 

【问题 3】 如 果 需 要 记录 课程 的 授课 教师 ， 新 增加 “授课 教师 ”实体 。 请 对 图 14-1 进行 修 
改 ， 画 出 修改 后 的 实体 间 联 系 和 联系 的 类 型 。 

案例 分 析 : 通过 本 案例 学 习 要 求 掌 握 数 据 库 概 念 结构 设计 中 E_R 图 , 及 如 何 从 概念 结构 向 


逻辑 结构 转换 的 基础 知识 。 
【问题 1】 分 析 


根据 题 意 由 “一 门 含 实验 的 课程 可 以 


设 给 多 个 班级 ， 每 个 班级 每 学 期 可 以 开设 多 门 含 实 
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验 的 课程 ”可 知 课程 和 班级 之 间 的 开设 关系 为 m:n 联系 。 由 “一 个 实验 室 的 一 次 实验 可 以 分 配 
多 个 实验 员 负 责 辅 导 实验 ”可 知 实验 、 实 验 室 与 实验 员 之 间 的 安排 关系 为 k:n:m 联系 。 由 “ 实 
验 员 给 出 学 生 的 每 次 实验 成 绩 ” 可 知 实验 、 学 生 与 实验 员 之 间 的 成 绩 关 系 为 k:n:m 联系 。 班 级 
和 学 生 之 间 的 包含 关系 为 1:n 联系 。 补 充 完 整 的 E_R 图 如 图 14-2 所 示 。 


图 14-2 修改 后 的 实体 联系 图 


【问题 2】 分 析 

室 〈1) 应 填写 “课程 编号 ,班级 号 ” 因为 ， 根 据 题 意 可 知 课程 编号 是 课程 的 主键 ， 班 级 
号 是 班级 的 主键 。 从 表 14-1 可 见 ， 开 课 情况 是 体现 课程 与 班级 间 的 m:n 联系 ， 因 此 开课 情况 关 
系 模式 应 该 包含 课程 编号 和 班级 号 ， 并 共同 作为 主键 。 

空 (2) 应 填写 “实验 编号 ， 课 程 编 号 ”。 因 为 ， 一 门 课程 包含 多 次 实验 ， 实 验 与 课程 之 间 
是 m:1 关系 ， 因 此 ， 根 据 表 14-1， 实 验 关系 模式 应 包含 实验 编号 和 课程 编号 ， 并 且 以 实验 编号 
为 主键 ， 以 课程 编号 为 外 键 。 

空 (3) 应 填写 “实验 编号 ， 批 次 号 ， 安 排 学 期 ， 实 验 室 编号 ， 实 验 员 编 号 ”。 因 为 ， 在 制订 
试验 计划 时 ， 每 个 学 期 、 每 个 班 的 每 次 实验 可 能 按 实验 室 被 分 成 多 个 批 次 ， 每 个 批 次 的 实验 会 
有 若干 名 实验 员 来 辅导 学 生 实验 并 打分 。 从 表 14-2 可 见 ， 实 验 计划 关系 模式 应 记录 实验 编号 、 
批 次 号 和 授课 学 期 ， 并 且 共 同 作为 主键 。 

空 (4) 应 填写 “实验 员 编号 ， 实 验 员 姓 名 ”。 因 为 ， 实 验 员 关系 模式 应 该 记录 实验 员 编号 
和 实验 员 姓 名 ， 并 以 实验 员 编 号 为 主键 。 实 验 室 编号 是 实验 室 的 主键 。 

室 (5) 应 填写 “学 号 ， 班 级 号 ”。 因 为 ， 根 据 题 意 实验 课 是 按 班级 进行 分 批 次 安排 计划 ， 
所 以 学 生 关系 必须 说 明 该 学 生 是 属于 哪个 班级 的 。 

室 (6) 应 填写 “实验 编号 ， 学 号 ” 因为 ， 从 表 14-3 可 见 ， 实 验 成 绩 关 系 模式 记录 每 个 学 
生 的 每 次 实验 成 绩 ， 应 包含 学 号 和 实验 编号 ， 并 共同 作为 主键 。 
其 他 关系 模式 主键 : 课程 关系 的 主键 为 “课程 编号 >， 班级 关系 的 主键 为 “班级 号 ” 实验 
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室 关系 的 主键 为 “实验 室 编号 ”。 

【问题 3】 分析 

于 授课 教师 负责 给 若干 个 班级 开设 若干 门 课程 ， 因 此 ， 课 程 、 班 级 和 授课 教师 之 间 的 开 
设 关 系 是 k:n:m 联系 。 修 改 后 的 E_R 图 如 图 14-3 所 示 。 


图 14-3 ”修改 后 的 实体 联系 图 


14.2.2 ”旅游 管理 信息 系统 


系统 需求 分 析 是 在 项 目 确定 之 后 ， 用 户 和 设计 人 员 对 数据 库 应 用 系统 所 要 涉及 的 内 容 〈 数 
据 ) 和 功能 (行为 ) 的 整理 和 描述 ， 是 以 用 户 的 角度 来 认识 系统 。 这 一 过 程 是 后 续 开发 的 基础 ， 
以 后 的 逻辑 设计 和 物理 设计 以 及 应 用 程序 的 设计 都 会 以 此 为 依据 。 如 果 这 一 阶段 的 工作 没有 做 
好 ， 势 必 会 为 以 后 的 工作 带 来 困难 ， 要 再 重新 回 过 头 来 做 需求 分 析 ， 影 响 整个 项 目的 工期 ， 在 
人 力 、 物 力 等 方面 造成 浪费 。 因 此 ， 这 一 阶段 的 工作 要 求 做 到 耐心 细致 ， 这 在 整个 设计 开发 过 
程 中 是 最 困难 、 最 耗 时 的 一 步 。 

某 旅行 社 拟 开发 一 套 旅游 管理 系统 ， 以 便 管 理 旅游 相关 的 信息 。 


1. 需求 分 析 


(1) 旅行 社 可 发 布 旅游 线路 的 信息 ， 包 含 : 线路 的 价格 、 天 数 、 住 宿 情况 ， 以 及 具体 的 行 
程 安排 等 。 不 同 的 线路 参观 的 景点 及 住宿 情况 不 相同 ， 如 表 14-4 所 示 。 
(2) 游客 与 旅行 社 沟通 ， 选 择 适 合 自己 的 线路 ， 并 由 旅行 社 为 其 生成 订单 ， 以 记录 游客 联 
系 人 的 姓名 、 身 份 证 号 、 联 系 方式 、 人 数 、 所 选 线路 、 导 游 安排 和 票务 信息 。 旅 行 社 为 游客 在 
行程 中 的 每 个 城市 安排 一 个 负责 导游 ， 负 责 游 客 在 该 城市 的 具体 旅行 安排 。 同 一 城市 的 负责 导 
游 相同 ， 不 同城 市 的 负责 导游 有 可 能 不 同 。 

(3) 旅行 社 的 每 位 员工 只 属于 一 种 固定 的 员工 类 别 ， 系 统 可 记录 员工 的 多 部 手机 号 。 旅 行 
社 按 月 统计 导游 每 月 的 带 团 人 数 和 游客 投诉 次 数 ， 以 计算 导游 的 当月 月 薪 。 
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表 14-4 ”旅游 线路 信息 

价格 4 

景点 住宿 
接站 集合 ， 和 天安门、 紫禁城、 颐和园 5 建国 饭店 
上 午 参观 北京 胡同 ， 下 午 飞 往 西安 京 ， 西 安 花园 饭店 
上 午 参观 兵马俑 ， 下 午 参观 大 脸 塔 安 花园 饭店 


2. 逻辑 结构 设计 
根据 用 户 需 求 ， 初 步 设计 了 旅游 信息 数据 库 ， 其 关系 模式 如 图 14-4 所 示 。 


线路 信息 《线路 编号 ， 价 格 ， 天 数 ? 

线路 行程 信息 线路 编号 ， 日 程 号， 城市 ， 景 点 ， 住 宿 ) 

订单 信息 订单 号 ， 线 路 编号 ， 联 系 人 名 称 ， 联 系 人 身份 证 号 ， 人 数 ， 联 系 方式 ， 
订单 价格 ， te 负责 导游 工 号， 负责 城市 ) 


票务 信息 (车 票 班次 ， 车 票 类 型 ,票数 ， 总 价格 ， 出 发 地 ， 到 达 地 ， 始 发 时 间 , 日 期 ， 


订单 号 ) 
员工 信息 (员工 号 ， 姓名， 出 生日 期 ， 员 工 类 别 ， 手 机 号 ， 计 薪 月 ， 被 投诉 次 数 ， 带 
团 人 数 ， 月 薪 ) 


图 14-4 ”旅游 信息 数据 库 关系 模式 


关系 模式 中 主要 属性 的 含义 及 约束 如 表 14-5 所 示 。 

【问题 1】 对 关系 “线路 信息 ”， 请 回答 以 下 问题 : 

(1) 列举 出 所 有 不 属于 任何 候选 键 的 属性 非 键 属性 )。 

(2) 关系 “线路 信息 ”是 否 为 BCNF 范式 ， 用 60 字 以 内 文字 简要 叙述 理 
【问题 2】 对 关系 “订单 信息 ”， 请 回答 以 下 问题 ; 

(1)“ 订 单 信息 ”是 否 为 2NF 范式 ， 用 100 字 以 内 文字 简要 说 明 会 产生 什么 问题 。 

(2) 把 “订单 信息 ”分 解 为 第 三 范式 , 分解 后 的 关系 名 依次 为 : 订单 信息 1, 订单 信息 2,……。 
(3) 列 出 分 解 后 的 各 关系 模式 的 主键 。 

【问题 3】 对 关系 “员工 信息 ”， 请 回答 以 下 问题 : 

(1) 关系 “员工 信息 ”是 不 是 第 四 范式 ， 用 100 字 以 内 文字 叙述 理由 。 

(2) 若 “ 员 工 信 息 ” 不 是 第 四 范式 ， 将 其 分 解 为 第 四 范式 ， 分 解 后 的 关系 名 依次 为 : 员工 
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信息 1， 员工 信息 2, 
表 14-5 主要 属性 含义 及 约束 
属 性 含义 及 约束 条 件 
线路 编号 唯一 标识 一 条 旅游 的 线路 信息 
日 程 号 旅游 行程 中 的 某 一 天 ， 如 : D1 代表 第 1 天，Dn 代表 第 n 天 
住宿 不 同 线路 游客 在 不 同城 市 的 住宿 情况 说 明 
城市 旅游 行程 中 某 一 天 游客 所 在 的 城市 名 称 
景点 旅游 行程 中 某 一 天 游客 游览 的 景点 名 称 
人 数 某 个 订单 的 总 游客 数 
订单 价格 某 个 订单 的 总 价 
车 票 班 次 旅游 过 程 中 的 车 票 班次 ， 包 括 : 火车 车 次 、 航 班 班次 等 
车 票 类 型 车 票 类 型 分 为 : 飞机 、 火 车 
票数 针对 某 订单 某 班次 的 车 票数 量 
总 价格 针对 某 订单 某 班次 的 车 票 的 总 价格 
计 薪 月 某 员 工 的 被 投诉 次 数 和 月 薪 所 对 应 的 年 份 和 月 份 ， 如 : 2012 年 5 月 
手机 号 允许 一 个 员工 有 多 个 手机 号 
被 投诉 次 数 某 员工 某 计 薪 月 的 被 投诉 次 数 
带 团 人 数 某 员 工 某 计 薪 月 的 带 团 人 数 总 和 
月 薪 某 员工 某 计 薪 月 的 薪水 金额 
员工 类 别 员工 类 别 分 为 : 导游 或 其 他 


案例 分 析 : 本 案例 要 求 理 解 并 掌握 关系 数据 库 理论 的 规范 化 方面 的 基础 知识 。 


【问题 1】 分 析 


〈1)“ 线 路 信息 ”关系 模式 的 非 键 属性 为 : 价格 ， 天 数 。 因 为 ， 根 据 题 意 关系 模式 线路 信 
息 〈 线 路 编号 ， 价 格 ， 天 数 ) 的 候选 键 为 “线路 编号 ”所 以 不 属于 任何 候选 键 的 非 键 属性 为 : 


价格 ， 天 数 。 


(2)“ 线 路 信息 ”关系 模式 可 以 达到 BCNF 范式 。 因 为 ， 根 据 BCNF 范式 的 要 求 : 每 一 个 
函数 依赖 的 决定 因素 都 包含 码 。 而 “线路 信息 ”关系 模式 的 函数 依赖 为 :线路 编号 一 〈 价 格 ， 
天 数 )， 因 此 ,“ 线 路 信息 ”关系 模式 可 以 达到 BCNF 范式 。 


【问题 2】 分 析 
通过 问题 2 要 求 掌握 的 是 对 第 二 范式 和 第 三 范式 的 理 


a 解 。 


(1) 如 果 关系 达到 第 二 范式 ， 那 么 不 存在 非 主 属性 对 码 的 部 分 依赖 。 根 据 题 意 和 “ 订 六 
息 ” 关 系 模式 可 知 ， 不 属于 任何 候选 键 的 属性 ( 非 键 属性 ) 为 : 线路 编号 、 联 系 人 名 称 、 联 系 人 
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身份 证 号 、 人 数 、 联 系 方式 、 订 单价 格 、 出 发 时 间 和 负责 城市 。 


需要 根据 第 三 范式 的 要 求 和 “订单 信息 ”关系 模式 的 函数 依赖 ， 


“订单 信息 ”关系 模式 的 函数 依赖 集 如 下 : 


《订单 号 ， 负 责 导游 工 号 ) 一 负责 城市 


订单 号 一 (线路 编号 ， 联 系 人 身份 证 号 ， 人数， 订单 价格 ， 出 发 时 间 ) 


联系 人 身份 证 号 一 〈 联系 人 名 称 ， 联 系 方式 ) 


从 上 可 见 ,“ 订 单 信息 ”关系 模式 存在 非 主 属性 对 码 的 部 分 依赖 ， 


因此 ， 不 属于 第 二 范式 。 


(2) 根据 第 三 范式 的 要 求 : 每 一 个 非 主 属性 既 不 部 分 依赖 于 码 也 不 传递 依赖 于 码 。 因 此 ， 


分 解 以 满足 第 三 范式 的 要 求 。 分 解 后 的 关系 模式 如 下 : 


对 “ 订 六 


信息 ”关系 模式 进行 


订单 信息 1 (订单 号 ， 线 路 编号 ， 联 系 人 身份 证 号 ， 出 发 时 间 ， 订 单价 格 ， 人 数 ) 
订单 信息 2 (联系 人 身份 证 号 ， 联 系 人 名 称 ， 联 系 方式 ) 
订单 信息 3 (订单 号 ， 负 责 导 游 工 号 ， 负 责 城市 ) 


(3) 分 解 后 的 关系 模式 订单 信息 1、 订 单 信息 2 和 订单 信息 3 的 主键 分 别 为 : 订单 号 、 联 


系 人 身份 证 号 和 (订单 号 ， 负 责 导 游 工 号 ) 。 


【问题 3】 分 析 
通过 问题 2 要 求 掌握 的 是 第 四 范式 的 理解 。 


(1)“ 员 工 信 息 ” 关 系 模式 不 满足 第 四 范式 。 因 为 ， 根 据 第 四 范式 的 要 求 : 不 允许 有 非 平 


凡 且 非 函数 依赖 的 多 值 依赖 。 而 “员工 信息 ”关系 模式 的 函数 依赖 为 : 


员工 工 号 一 姓名， 年龄， 员工 类 别 
员工 工 号 一 一 手机 号 
员工 工 号 一 计 薪 月 ， 被 投诉 次 数 ， 带 团 人 数 ， 月 薪 


由 “员工 信息 ”关系 模式 的 函数 依赖 可 知 ,“ 员 工 信 息 ” 关 系 模式 存在 部 分 依赖 , 所 以 ,“ 员 


[信息 ”关系 模式 不 满足 第 二 范式 ; 而 “员工 信息 ”关系 模式 也 存在 多 值 依赖 ， 所 以 ,“ 员 工 
信息 ”关系 模式 不 满足 第 四 范式 。 


(2) 根据 第 四 范式 的 要 求 和 “员工 信息 ”关系 模式 的 函数 依赖 ， 


进行 分 解 以 满足 第 四 范式 的 要 求 。 分 解 后 的 关系 模式 如 下 : 


对 “ 员 了 


[信息 ”关系 模式 


员工 信息 1 (员工 工 号 ， 姓 名 ， 年 龄 ， 员 工 类 别 ) 


员工 信息 2 (员工 工 号 ， 手 机 号 ) 
员工 信息 3 (员工 工 号 ， 计 薪 月 ， 被 投诉 次 数 ， 带 团 人 数 ， 月 薪 ) 
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14.2.3 图 书 管理 信息 系统 

数据 库 概念 结构 设计 阶段 是 在 需求 分 析 的 基础 上 ， 依 照 需求 分 析 中 的 信息 要 求 ， 对 用 户 信 
息 加 以 分 类 、 聚 集 和 概括 ， 建 立信 息 模型 ， 并 依照 选 定 的 数据 库 管理 系统 软件 ， 转 换 成 为 数据 
的 逻辑 结构 ， 再 依照 软 硬 件 环境 ， 最 终 实现 数据 的 合理 存储 。 这 一 过 程 也 称 为 数据 建 模 。 这 一 
过 程 可 分 解 为 三 个 阶段 ， 概 念 结构 设计 、 逻 辑 结构 设计 和 物理 结构 设计 。 

某 单位 图 书馆 需要 建立 一 个 图 书 管理 系统 ， 在 图 书 管理 过 程 中 ， 由 于 要 处 理 多 种 不 同 的 业 
务 流程 ， 各 个 部 门 之 间 有 相互 联系 。 


1， 图 书 管理 需求 分 析 


通过 对 图 书 管理 日 常 工作 的 详细 调查 , 该 图 书馆 对 某 书 目的 信息 如 表 14-6 所 示 , 与 该 书目 
对 应 的 图 书信 息 如 表 14-7 所 示 。 


表 14-6 书目 信息 


- 
流通 室 


1) 初步 的 需求 分 析 结 果 

(1) 资料 室 有 图 书 管理 员 若 干 名 ， 他 们 负责 已 购 入 图 书 的 编目 和 借 还 工作 ， 每 名 图 书 管理 
员 的 信息 包括 工 号 和 姓名 。 

(2) 读者 可 在 阅览 室 读 书 ， 也 可 通过 图 书 流 通 室 借 还 图 书 ， 读 者 信息 包括 姓名 、 年 龄 、 工 
作 单 位 、 借 书证 号 、 电 话 和 E-mail， 系 统 为 不 同 读者 生成 不 同 的 借 书证 号 。 
(3) 每 部 书 在 系统 中 对 应 唯一 的 一 条 图 书 在 版 编目 数据 CIP， 以 下 简称 书目 )， 书 目的 基 
本 信息 包括 ISBN 号 、 书 名 、 作 者 、 出 版 商 、 出 版 年 月 以 及 本 资料 室 拥 有 该 书 的 册 数 (以 下 简 
称 册 数 )， 不 同 书目 的 ISBN 号 不 相同 。 

(4) 资料 室 对 于 同一 书目 的 图 书 可 拥有 多 册 《〈 本 )， 图 书信 息 包括 图 书 ID、ISBN 号 、 存 放 
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位 置 和 当前 状态 ， 每 一 本 书 在 系统 中 被 赋予 唯一 的 图 书 了 D。 

(5) 一 名 读者 最 多 只 能 借阅 10 本 图 书 ， 且 每 本 图 书 最 多 只 能 借 两 个 月 ， 读 者 借 书 时 需 由 
图 书 管理 员 登 记 读者 D、 所 借 图 书 ID、 借 阅 时 间 和 应 还 时 间 ， 读 者 还 书 时 图 书 管理 员 在 对 应 
的 借 书 信息 中 记录 归还 时 间 。 

(6) 当 某 书目 的 可 借 出 图 书 的 数量 为 0 时 ， 读 者 可 以 对 其 进行 预约 登记 ， 即 记录 读者 ID、 
需要 借阅 的 图 书 的 ISBN 号 和 预约 时 间 。 

2) 业务 流程 

图 书 管理 信息 系统 在 应 用 中 的 业务 流程 图 如 图 14-5 所 示 。 


借 书 证 号 、 
图 书 编号 、 
姓名 等 


借 书 证 号 、 
图 书 编号 


借阅 情况 
读者 情况 


图 14-5 ”图 书 管理 业务 流程 图 


系统 的 主要 业务 处 理 如 下 。 

(1) 入 库 管 理 。 图 书 购 进入 库 时 ， 管 理 员 查询 本 资料 室 的 书目 信息 ， 若 该 书 的 书目 尚未 建立 ， 
则 由 管理 员 编写 该 书 的 书目 信息 并 录入 系统 , 然后 编写 并 录入 图 书信 息 ; 否则 , 修改 该 书目 的 册 数 ， 
然后 编写 并 录入 图 书信 息 。 对 于 进入 流通 室 的 书 ， 其 初始 状态 为 “未 借 出 ”， 而 送 入 阅览 室 的 书 的 
状态 始终 为 “不 外 借 ”。 

(2) 图 书证 注册 和 注销 。 登 记 所 有 办 理 的 新 图 书证 和 注销 图 书证 ， 需 要 注 明 办 理 及 注销 日 
期 及 管理 员 号 。 

(3) 挂失 管理 。 包 括 挂失 登记 ， 登 记 挂失 的 图 书证 ， 使 得 该 图 书证 不 能 借 书 ， 注 明 挂失 日 
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期 及 管理 员 号 ， 解 除 挂失 ， 解 除 已 经 挂失 的 图 书证 ， 使 得 该 借 书 证 可 以 开始 借 书 ， 注 明 解 除 挂 
失 日 期 及 管理 员 号 。 

(4) 借 书 管理 。 读 者 借 书 时 ， 若 有 ， 则 由 管理 员 为 该 读者 办 理 借 书 手续 ， 并 记录 该 读者 的 借 
书信 息 ， 同 时 将 借 出 图 书 的 状态 修改 为 “已 借 出 ”。 

(5) 预约 管理 。 若 图 书 流通 室 没有 读者 要 借 的 书 ， 则 可 为 该 读者 建立 预约 登记 ， 需 要 记录 读 
者 ID、 书 的 ISBN 号 、 预 约 时 间 和 预约 期 限 〈 最 长 为 10 天 )。 一 旦 其 他 读者 归还 这 种 书 ， 就 自 
动 通知 该 预约 读者 。 系 统 将 自动 清除 超出 预约 期 限 的 预约 记录 并 修改 相关 信息 。 

(6) 还 书 管理 。 读 者 还 书 时 ， 则 记录 相应 借 还 信息 中 的 “归还 时 间 ” 对 于 超期 归还 者 ， 系 
统 自动 计算 罚金 (具体 的 计算 过 程 此 处 省 略 )。 系 统 同 时 自动 查询 预约 登记 表 ， 若 存在 其 他 读者 预 
约 该 书 的 记录 ， 则 将 该 图 书 的 状态 修改 为 “已 预约 ” 并 将 该 图 书 ID 写 入 相应 的 预约 记录 中 (系统 
在 清除 超出 预约 期 限 的 记录 时 解除 该 图 书 的 “已 预约 ”状态 )， 否则 ， 将 该 图 书 的 状态 修改 为 “未 
借 出 ” 

(7) 通知 处 理 。 对 于 已 到 期 且 未 归还 的 图 书 ， 系 统 通过 E-mail 自动 通知 读者 。 若 读者 预约 的 
书 已 到 ， 系 统 则 自动 通过 E-mail 通知 该 读者 来 办 理 借 书 手续 。 


2， 图 书 管理 概念 结构 设计 


根据 需求 分 析 的 结果 设计 的 实体 联系 图 (不 完整 ) 如 图 14-6 所 示 ， 请 指出 读者 与 图 书 、 书 
目 与 读者 、 书 目 与 图 书 之 间 的 联系 类 型 ， 并 补充 图 14-6 中 实体 间 缺 少 的 联系 。 


图 14-6 ”图书 管 理 系统 的 实体 联系 图 


1) 联系 类 型 

读者 与 图 书 、 书 目 与 图 书 、 书 目 与 读者 之 间 的 联系 类 型 分 析 如 下 。 

(1) 读者 与 图 书 之 间 的 联系 类 型 。 读 者 与 图 书 之 间 形 成 了 借 还 关系 ， 需 求 分 析 的 结果 已 经 
说 明 “ 一 名 读者 最 多 只 能 借阅 10 本 图 书 ” 显然 一 本 图 书 可 被 多 名 读者 借阅 ， 而 每 名 读者 应 该 
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区 ， 因 此 读者 与 图 书 之 间 的 借 还 联系 为 多 对 多 (n:m)， 即 空 (1) 和 空 (2) 应 


能 够 借阅 多 本 图 
分 别 填写 n 和 m。 

(2) 书目 与 图 书 之 间 的 联系 类 型 。 图 书馆 对 于 同一 书目 的 图 书 可 拥有 多 册 (本 )， 每 一 本 
书 在 系统 中 被 赋予 唯一 的 图 书 DD， 所 以 书目 与 图 书 之 间 的 联系 类 型 为 一 对 多 (1:n)， 即 空 (3) 
和 空 (4) 应 分 别 填写 1 和 ne。 

(3) 书目 与 读者 之 间 的 联系 类 型 。 当 某 书目 的 可 借 出 图 书 的 数量 为 0 时 ， 读 者 可 以 对 其 进 
行 预约 登记 ， 由 于 一 名 读者 可 借阅 多 种 图 书 ， 因 此 书目 与 读者 之 间 的 预约 联系 类 型 为 多 对 多 
Cn:m)， 即 室 (5) 和 空 (6) 应 分 别 填写 n 和 m。 

2) 图 书馆 管理 E-R 模型 

根据 需求 分 析 的 结果 ， 图 书馆 管理 应 该 包括 图 书证 注册 、 注 销 和 挂失 管理 ， 因 此 在 图 14-6 
中 ， 管 理 员 和 读者 实体 间 缺 少 的 联系 有 注册 、 注 销 和 挂失 借 书 证 管理 联系 。 补 充 缺 少 的 联系 的 


E-R 模型 如 图 14-7 所 示 。 


图 14-7 补充 缺少 的 联系 的 图 书 管理 系统 的 实体 联系 图 


3 图 书 管理 逻辑 结构 设计 


根据 概念 设计 得 到 的 E-R 图 转换 成 图 书 管理 系统 的 主要 关系 模式 如 下 , 请 补充 “ 借 还 记录 ” 
和 “预约 登记 ”关系 中 的 空缺 。 注 : 时 间 格 式 为 “年 .月 .日 时 :分 : 秒 ” 请 指出 读者 、 书 目 关 系 
模式 的 主键 ， 以 及 图 书 、 借 还 记录 和 预约 登记 关系 模式 的 主键 和 外 键 。 

管理 员 〈 工 号 ， 姓 名 ， 权 限 ) 

读者 〈 姓 名 ， 年龄， 工作 单位 ， 借 书证 号 ， 电 话 ，E-mail) 

书目 (ISBN 号 ， 书 名 ， 作 者 ， 出 版 商 ， 出 版 年 月 ， 册 数 ， 工 号 ) 
图 书 〈 图 书 ID，ISBN 号 ， 存 放 位 置 ， 状 态 ， 工 号 ) 
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借 还 记录 (a) ， 借 出 时 间 ， 应 还 时 间 ， 归 还 时 间 ) 
预约 登记 ( (b) ， 预 约 时 间 ， 预 约 期 限 ， 图 书 ID) 
借 书 证 管理 〈 借 书证 号 ， 使 用 状态 ， 开 始 时 间 ， 结 束 时 间 ， 工 号 ) 
1) 问题 分 析 
由 于 读者 借 书 时 需 由 图 书 管理 员 登 记 借 书 证 号 、 所 借 图 书 ID、 借 出 时 间 和 应 还 时 间 ， 还 书 
对 图 书 管理 员 在 对 应 的 借 书 信息 中 记录 归还 时 间 ， 因 此 借 还 记录 关系 中 的 空 (a) 处 应 填 入 “ 借 
书证 号 ,图书 ID”。 

读者 对 某 书目 进行 预约 登记 时 ， 需 记录 借 书 证 号 、 需 要 借阅 的 图 书 的 ISBN 号 和 预约 时 间 
等 ， 目 前 的 预约 登记 关系 中 已 经 有 预约 时 间 、 预 约 期 限 、 图 书 ID 信息 ， 显 然 还 需要 记录 是 明 
位 读者 预约 了 书 ， 以 及 书 的 ISBN 号 ， 因 此 ， 预 约 登 记 关系 模式 中 的 空 (b) 处 应 填 入 “ 借 书 证 
号 ，ISBN 号 ”。 

2) 主键 与 外 键 分 析 

主键 也 称 为 主 码 ， 是 关系 中 的 一 个 或 一 组 属性 ， 其 值 能 唯一 标识 一 个 元 组 。 根 据 图 书 管理 
的 需求 分 析 如 下 。 

(1) 管理 员 关 系 。 主 键 显然 是 “ 工 号 ”。 

(2) 读者 关系 。“ 系 统 为 不 同 读者 生成 不 同 的 借 书 证 号 ” 因此 读者 关系 的 主键 显然 是 “ 借 
书证 号 ”。 

(3) 书目 关系 。 不 同 书目 的 ISBN 号 不 相同 ， 书 目 关系 的 主键 为 书 的 “ISBN 号 ” 外 键 是 
管理 员 关系 的 “ 工 号 ”。 

(4) 图 书 关系 。 同 一 书目 的 多 册 《〈 本 ) 图 书 具 有 相同 的 ISBN 号 ， 因 此 所 有 的 图 书 依据 “图 
书 ID” 相 互 区 分 ， 图 书 关系 的 主键 是 “图 书 ID ” 外 键 是 书目 关系 的 “ISBN 号 ”和 管理 员 关 系 的 
“ 工 号 ” 

(5) 借 还 记录 关系 。 用 于 记录 读者 的 借 书 和 还 书信 息 ， 为 了 区 分 读者 在 同一 日 期 对 同一 本 书 多 
次 借 还 ， 借 还 记录 的 主键 为 “ 借 书 证 号 , 图 书 ID， 借 出 时 间 ”。 借 还 记录 是 由 联系 借 还 对 应 的 关 
系 ， 它 记录 与 图 书 和 读者 的 联系 。 因 此 ， 借 还 记录 具有 外 键 借 书 证 号 和 图 书 ID， 分 别 与 读者 和 
图 书 相关 联 。 
(6) 预约 登记 关系 。 主 键 为 “ 借 书证 号 ，ISBN 号 ， 预 约 时 间 ” 外 键 为 读者 关系 的 “ 借 书 证 
号 ”书目 关系 的 “ISBN 号 ”和 图 书 关系 的 “图 书 ID”。 

(7) 借 书 证 管理 关系 。 主 键 为 “ 借 书 证 号 ， 开 始 时 间 ”， 外 键 是 管理 员 关 系 的 “ 工 号 ”。 

在 实现 数据 库 逻 辑 结构 设 计 之 后 ， 就 要 确定 数据 库 在 计算 机 中 的 具体 存储 。 由 于 数据 库 在 
物理 设备 上 的 存储 结构 与 存 取 方法 依赖 于 给 定 的 计算 机 系统 和 应 用 环境 ， 故 案例 中 不 再 介绍 。 


